Comunicação e colaboração

Concluído

A partilha atempada e clara de informações é um elemento essencial para responder eficazmente a incidentes ao longo de todo o ciclo de vida de resposta a incidentes. A comunicação é importante em todas as fases:

  • Deteção: Comunicar às pessoas adequadas que um incidente ocorreu e a natureza/gravidade geral do incidente e impacto.
  • Resposta: Comunique os detalhes sobre o incidente à medida que o processo de diagnóstico prossegue, quais etapas são necessárias para corrigir o problema e quem deve fazer o quê.
  • Remediação: Comunicar como e quando o serviço foi restabelecido ao funcionamento normal e as ações de acompanhamento necessárias.
  • Análise: Comunique as lições aprendidas com o incidente e o que pode ser feito para evitar que ele aconteça novamente.
  • de Prontidão: Comunicar alterações (ou alterações necessárias) ao plano de resposta a incidentes, aos nossos procedimentos e aos nossos sistemas que resultaram das lições aprendidas com este incidente.

Priorize uma comunicação clara

No início deste módulo, mencionamos que as organizações de elite/alto desempenho adotam uma abordagem proativa em vez de reativa. Mudar sua postura de reagir para responder de forma eficaz a incidentes vem como um subproduto de priorizar e permitir uma comunicação boa, clara e precisa.

As chaves para priorizar uma comunicação clara incluem:

  • Certifique-se de que está a partilhar informações sobre o que está a acontecer em cada etapa do processo.
  • Documentar a informação; Coloque-o por escrito para que seja menos provável que seja mal compreendido ou esquecido.
  • Coloque as informações em um local centralizado, onde elas estarão acessíveis a todos que precisarem.
  • Utilize ferramentas para aumentar a eficácia das comunicações.

Apesar de não termos chamado a atenção na altura, estes são todos comportamentos que demonstrámos na última unidade.

Ferramentas de comunicação: ChatOps

Antes de falar sobre ferramentas de comunicação, você precisa aprender sobre o ChatOps, que não é uma ferramenta específica, mas um modelo de colaboração orientado por conversa. É popular entre os desenvolvedores por reunir pessoas, ferramentas, processos e automação. O ChatOps oferece uma maneira nova e melhor para as equipes trabalharem, aproveitando o bate-papo em grupo em vez de depender de tecnologias mais antigas, como o e-mail, para colaborar.

Em sua forma avançada, o ChatOps pode usar bots personalizados e inteligência artificial para automatizar o trabalho. No contexto da resposta a incidentes, você pode usar o ChatOps para trazer ferramentas de bate-papo em grupo para a conversa. Trabalhar dessa forma pode incentivar fortemente os engenheiros a se reunirem em bate-papo em grupo e colaborarem em problemas e incidentes, bem como nos esforços normais de engenharia.

O chat de grupo ajuda você a compartilhar mais sobre o que está acontecendo em seu sistema em termos de conhecimento institucional e obtém essas informações da cabeça das pessoas e para o bate-papo para que possam ser compartilhadas e usadas por outras pessoas.

Isso aumenta a visibilidade e a consciência operacional em toda a equipe e ajuda os outros a aprender a fazer o que devem fazer. Quando você executa comandos e compartilha o que está fazendo no bate-papo, você está ensinando aos outros o que fazer e como fazê-lo.

A aprendizagem é um subproduto de compartilhar mais sobre o que está acontecendo dentro da engenharia. Quando você entende mais sobre o que seus colegas, colegas de trabalho e liderança estão fazendo e pensando, incluindo como eles tomam decisões, você é capaz de ser mais empático sobre o que está acontecendo. Tudo isso acontece de forma mais natural quando você começa a mover seu trabalho para o chat.

Use o Microsoft Teams em sua solução ChatOps

Você já aprendeu como o Microsoft Teams pode ser uma parte importante do seu kit de ferramentas de comunicação durante um incidente. Você pode criar uma ponte de conversa com o canal dedicado ao incidente e até mesmo usar o Logic Apps para automatizar a publicação dos detalhes do incidente diretamente no canal.

Como o Microsoft Teams é um local centralizado onde temos muitas conversas sobre nossos esforços de engenharia, é um bom lugar para começar em sua solução ChatOps para fornecer atualizações de status e contexto adicional.

Por exemplo, você pode usar um webhook do Teams para atualizar uma página de status. Você pode configurar o Teams para ouvir um determinado comando em um bate-papo e, se recebido, enviar uma solicitação para outro aplicativo. Esse aplicativo simples pode ser uma Função do Azure que atualiza uma página HTML estática armazenada no Armazenamento de Blobs do Azure com informações sobre o incidente em andamento. O resultado final é que um simples comando no chat fornece uma atualização para outras partes interessadas que não estão no chat. Esta etapa simples economiza tempo que, de outra forma, poderia ser gasto atualizando aqueles que não estão envolvidos na resposta.

Até agora, gastamos nosso tempo analisando as fases antes da remediação. Vamos agora mudar nosso foco para maneiras de melhorar essa fase.