DEV Community

Mike Fortes
Mike Fortes

Posted on • Originally published at mromeiro-f.Medium on

Do zero ao completo Desastre

Recentemente tive um cliente que cresceu MUITO em pouquíssimo tempo, perdendo completamente as rédeas do seu ambiente de monitoração. Como retomar o controle? Como evitar que ocorra novamente? Onde erraram pra que isso acontecesse? Vamos lá.

Em 2 anos, um cliente com parque de uma centena de servidores monitorados (infra e aplicação) foi para quase 4 mil servidores e equipamentos monitorados, somando pouco mais de meio milhão de itens monitorados. Sem profissionais especialistas que dessem auxilio no crescimento do ambiente, o caos foi instalado com sucesso.

  • Bancos de dados não otimizados
  • Proxys não padronizados
  • Diversas automações

E com o tempo, todo esse ambiente caótico se tornou o core de todo seu suporte técnico, funcionando ou não, esse era nosso ponto de partida.

Aqui vou tentar trazer alguns pontos cruciais a serem observados dentro do seu ambiente, para que se você assim como meu cliente tambem tenha crescido muito nos ultimos anos, identifique melhorias e procure ajuda antes que o caos tambem seja sua realidade.

Essa informação é mesmo importante?

Existem sim dúzias e dúzias de métricas que podem ser interessantes para seu negócio e que devem sim ser coletadas e armazenadas… mas existe o triplo disso que não é.

Muitos clientes gastam fortunas com bancos de dados, quando na verdade estão armazenando toneladas de dados inúteis.

Imagina você coletando a versão do sistema operacional de uma maquina a cada 1 hora, e armazenando esse texto imenso no banco de dados…

Revise seus templates, reveja prioridades… Oque deve ser guardado? Por quanto tempo preciso dessas informações? Esse item vai mesmo sofrer alterações em um intervalo tão curto de tempo?

No caso acima, questões como textos que devem ser monitorados mas não guardados em banco de dado, pode ser utilizado a solução dada nesse post onde ensino a criar monitoramentos mais performáticos, sem impactar negativamente seu banco de dados.

Automações? Quero

Quer dizer que você quer integrar seu Zabbix com o telegram, email, Slack. Criar hosts via ServiceNow que se integram em outra esteira que instala o agent e atribui templates e o proxy destinado para aquela range, atualizar pacotes, importar scri……

Sei que quando mais integrações e automações você tiver, mais seu Zabbix fica eficiente, produtivo de forma barata… mas até que ponto?

Sempre que criar uma automação/integração pense que isso vai estar lá pra sempre, talvez até mesmo depois de você, logo deve ser obrigatório ter uma DOCUMENTAÇÃO.

Cavando ambientes gigantes como esse sem documentação alguma, você começa a descobrir scripts e automações que nunca ouviu falar, e começa a documentar cada parte de seu funcionamento para que seu entendimento seja completo no futuro.

Mas infelizmente esse trabalho só ocorre em momentos críticos, onde a integração parou de funcionar no meio de uma sexta-feira, e sua equipe vai precisar virar a noite tentando fazer com que seu negócio volte a operar corretamente, fazendo com que seu tempo indisponivel se torne mais caro que o tempo do funcionario que implementou aquela integração e poderia ter documentado a mesma ali mesmo.

Não seja enganado

A moda agora é abstrair esse proxy pra que ele rode de dentro de uma caixa de fosforo, todo lugar está usando isso, vou usar também, vai dar certo…

https://medium.com/media/ba438a21cd9041c4c5fa08e9b3460c35/href

Não caia nessa pelo amor de deus.

Existe o certo e o duvidoso, e ao menos que você tenha DIVERSOS especialistas que tenham conhecimento sólido na ferramenta que estão tentando te fazer apostar suas fichinhas, não aposte, porque depois que seu ambiente crescer e seu parque estiver gigante… vai ser bem mais complicado uma migração caso o milagre que te venderam não performe como deveria !

Aqui deixei meus 2 centavos sobre o assunto, mas claro que como sempre falo, é minha visão sobre um assunto, e você pode discordar de algo ou tudo… é perfeitamente normal!

Até mais !

Top comments (0)