Comunicação e colaboração
A partilha atempada e clara de informações é um elemento essencial para responder eficazmente a incidentes ao longo de todo o ciclo de vida de resposta a incidentes. A comunicação é importante em todas as fases:
- Deteção: Comunicar às pessoas adequadas que um incidente ocorreu e a natureza/gravidade geral do incidente e impacto.
- Resposta: Comunique os detalhes sobre o incidente à medida que o processo de diagnóstico prossegue, quais etapas são necessárias para corrigir o problema e quem deve fazer o quê.
- Remediação: Comunicar como e quando o serviço foi restabelecido ao funcionamento normal e as ações de acompanhamento necessárias.
- Análise: Comunicar as lições aprendidas com o incidente e o que pode ser feito para evitar que ele aconteça novamente.
- Prontidão: Comunicar alterações (ou alterações necessárias) ao plano de resposta a incidentes, aos nossos procedimentos e aos nossos sistemas que resultaram das lições aprendidas com este incidente.
Priorizar para uma comunicação clara
No início deste módulo, mencionamos que as organizações de elite/alto desempenho adotam uma abordagem proativa em vez de reativa. Mudar a sua postura de reagir para responder eficazmente aos incidentes vem como um subproduto de priorizar e permitir uma comunicação boa, clara e precisa.
Os principais pontos para priorizar uma comunicação clara incluem:
- Certificar-se de que está a partilhar informações sobre o que se passa em cada passo do percurso.
- Documentar a informação; Coloque-o por escrito para que seja menos provável que seja mal compreendido ou esquecido.
- Colocar as informações num local centralizado onde estará acessível a todos os que delas necessitem.
- Utilizar ferramentas para aumentar a eficácia das comunicações.
Apesar de não o termos dito na altura, estes são todos os comportamentos que demonstrámos na última unidade.
Ferramentas de comunicação: ChatOps
Antes de falar sobre ferramentas de comunicação, você precisa aprender sobre o ChatOps, que não é uma ferramenta específica, mas um modelo de colaboração orientado por conversa. É popular entre os desenvolvedores por reunir pessoas, ferramentas, processos e automação. O ChatOps oferece-lhe uma nova e melhor forma de as equipas trabalharem, tirando partido do chat de grupo em vez de confiarem em tecnologias mais antigas, como o e-mail, para colaborar.
Na sua forma mais avançada, o ChatOps pode utilizar bots personalizados e inteligência artificial para automatizar o trabalho. No contexto da resposta a incidentes, você pode usar o ChatOps para trazer ferramentas de bate-papo em grupo para a conversa. Trabalhar dessa forma pode incentivar fortemente os engenheiros a se reunirem em bate-papo em grupo e colaborarem em problemas e incidentes, bem como nos esforços normais de engenharia.
O chat de grupo ajuda você a compartilhar mais sobre o que está acontecendo em seu sistema em termos de conhecimento institucional e obtém essas informações da cabeça das pessoas e para o bate-papo para que possam ser compartilhadas e usadas por outras pessoas.
Isso aumenta a visibilidade e a consciência operacional em toda a equipe e ajuda os outros a aprender a fazer o que devem fazer. Quando você executa comandos e compartilha o que está fazendo no bate-papo, você está ensinando aos outros o que fazer e como fazê-lo.
A aprendizagem é um subproduto de compartilhar mais sobre o que está acontecendo dentro da engenharia. Quando você entende mais sobre o que seus colegas, colegas de trabalho e liderança estão fazendo e pensando, incluindo como eles tomam decisões, você é capaz de ser mais empático sobre o que está acontecendo. Tudo isto acontece mais naturalmente quando começa a mudar o seu trabalho para o chat.
Utilizar o Microsoft Teams na solução ChatOps
Já aprendeu como o Microsoft Teams pode ser uma parte importante do seu kit de ferramentas de comunicações durante um incidente. Você pode criar uma ponte de conversa com o canal dedicado ao incidente e até mesmo usar o Logic Apps para automatizar a publicação dos detalhes do incidente diretamente no canal.
Como o Microsoft Teams é um local centralizado onde temos muitas conversas sobre nossos esforços de engenharia, é um bom lugar para começar em sua solução ChatOps para fornecer atualizações de status e contexto adicional.
Por exemplo, pode utilizar um webhook do Teams para atualizar uma página de estado. Você pode configurar o Teams para ouvir um determinado comando em um bate-papo e, se recebido, enviar uma solicitação para outro aplicativo. Esse aplicativo simples pode ser uma Função do Azure que atualiza uma página HTML estática armazenada no Armazenamento de Blobs do Azure com informações sobre o incidente em andamento. O resultado final é que o simples comando no chat fornece uma atualização para intervenientes adicionais que não estão no chat. Esta etapa simples economiza tempo que, de outra forma, poderia ser gasto atualizando aqueles que não estão envolvidos na resposta.
Até agora, gastamos nosso tempo analisando as fases antes da remediação. Vamos agora mudar nosso foco para maneiras de melhorar essa fase.