Práticas úteis para aprender com o fracasso

Concluído

Agora que você está ciente de algumas das armadilhas comuns que podem sabotar ou, pelo menos, limitar o valor que você pode obter de suas avaliações pós-incidente, a próxima pergunta lógica é "o que você deve fazer em vez disso?"

Nesta unidade, você aprenderá quatro práticas úteis que podem melhorar o processo de análise pós-incidente.

Prática 1: Executar uma revisão pós-incidente facilitada

Você já sabe que uma revisão pós-incidente não é um documento ou relatório — idealmente é uma conversa — então segue-se que apenas ter uma única pessoa escrevendo um "post mortem" do que aconteceu sem qualquer discussão não faz uma revisão pós-incidente útil. Não importa quão experiente ou profundamente envolvida no incidente essa pessoa possa estar, não se aprenderá muito se tudo vier de um único ponto de vista.

Reunir ao mesmo tempo aqueles que estiveram envolvidos no incidente é o primeiro passo. Muitas vezes, é útil ter um facilitador nessa reunião que possa ajudar a orientar a discussão. Idealmente, esse facilitador deve ser alguém "neutro" que não tenha participado do incidente. Todos aprenderão mais se o facilitador não parecer ter ideias preconcebidas ou uma agenda pessoal ao contar a história do incidente.

O formato exato da reunião dependerá da sua equipe, do agendamento e da natureza do incidente, mas aqui estão algumas diretrizes básicas:

  • Reuniões, não maratonas: As reuniões não precisam ser longas. Geralmente, 60 a 90 minutos é o período máximo de tempo que a maioria das pessoas pode se concentrar totalmente e participar de forma eficaz, portanto, limite a reunião a não mais de uma hora e meia.
  • Preparação pré-reunião: Para aproveitar melhor o tempo da reunião, pode ser útil para o facilitador preparar-se através da realização de entrevistas individuais com alguns dos membros da equipa de resposta, a fim de obter uma visão geral do incidente e ideias sobre quais tópicos discutir na reunião. As entrevistas individuais podem ser reportadas ao grupo se houver preocupação com questões interpessoais ou personalidades que dificultem a reunião (ou se os indivíduos não se sentirem confortáveis em se apresentar na frente da sala por qualquer motivo).
  • Não obrigatório para todos os incidentes: Este é um processo de aprendizagem, e você está "aprendendo a aprender", então comece pequeno. Você não precisa fazer isso para todos os incidentes. Pode escolher à vontade. Você pode querer começar com incidentes menores ou começar com uma reunião de revisão apenas uma vez por mês.

A reunião de revisão pós-incidente é uma oportunidade para descobrir o que deu errado, o que foi feito certo e como você pode lidar melhor com falhas no futuro. O objetivo final é melhorar a fiabilidade.

Prática 2: Faça perguntas melhores

Você já sabe que a linguagem é importante e, na revisão pós-incidente, isso se aplica especialmente às perguntas que você faz. As perguntas objetivas suscitam normalmente respostas mais úteis.

Em particular, é melhor perguntar às pessoas "como" ou "o quê" em vez de "porquê".

Quando se pede às pessoas que expliquem "por que" fizeram algo ou "por que" algo aconteceu, isso tende a colocá-las na defensiva. Começar uma pergunta com "porquê" muitas vezes surge como um julgamento, crítica ou acusação. Isso força as pessoas a justificar suas ações, e as pessoas nem sempre sabem por que fizeram algo ou por que algo aconteceu como resultado de suas ações. Também pode levar as pessoas a saltar diretamente para uma causa de problema ou uma conclusão, ignorando uma riqueza de informações que poderiam ser discutidas. Por exemplo, se você perguntar "por que o sistema parou de funcionar?", a resposta pode ser "Porque o disco encheu". Isso ignora questões importantes como "como você notou que havia um problema com o disco?" ou até mesmo "qual foi a primeira coisa que você verificou no sistema, o que o levou a verificá-lo?"

Isso não significa que você não possa explorar os fatores que contribuem para o incidente ou o raciocínio que uma pessoa usou para decidir o que fazer em resposta a eles, significa apenas que você deve prestar atenção em como você formula essas perguntas:

Não pergunte "por que você fez isso?"

Em vez disso, pergunte "o que levou a sua decisão de fazer essa mudança?"

Não pergunte "por que isso não foi pego no canário?"

Em vez disso, pergunte "quão eficaz é geralmente o canário em detectar esse tipo de problema?"

Lembre-se de que a revisão pós-incidente é sobre aprendizagem. É provável que cada participante no incidente tenha uma visão ligeiramente diferente dos acontecimentos. Você aprenderá mais se fizer perguntas que exponham essas múltiplas visões e interpretações.

Muitas vezes, você aprenderá tanto perguntando sobre como o trabalho "normalmente" acontece quanto perguntando sobre o incidente específico.

Para saber mais sobre como fazer perguntas melhores, confira este recurso:

Guia de Facilitação do Etsy Debriefing

Prática 3: Pergunte como as coisas correram bem

Quando você pensa em aprender com o fracasso, você pode esquecer que, mesmo dentro de uma grande interrupção ou outro incidente, além das coisas que dão errado, também há coisas que dão certo. Longe da nossa visão dos incidentes como pontuais ou produtos de condições extremas, na maioria dos sistemas complexos as coisas correm mal por muitas das mesmas razões pelas quais correm bem.

É da natureza humana focar suas perguntas no lado negativo da equação. No entanto, também perguntar sobre como as coisas correram bem irá fornecer-lhe insights que você não teria obtido de outra forma.

Não pergunte apenas como a interrupção aconteceu, pergunte também sobre como você se recuperou.

Você vai querer saber quais insights, ferramentas, habilidades e pessoas ajudaram no esforço de recuperação. Essas são coisas que você quer ser capaz de reproduzir, então essas informações são valiosas para planejar o que fazer daqui para frente.

Neste contexto, pretende perguntar como é que as pessoas ficaram a saber o que sabiam e com que base tomaram as decisões que tomaram. Houve um momento crítico em que alguém partilhou uma informação que ajudou a desvendar o puzzle do que estava a acontecer? Como eles souberam fazer isso? De onde veio a informação?

Procure temas e padrões. Por fim, como parte do reconhecimento do que deu certo, pergunte: "O que você sabe agora que não sabia antes?" Se o aprendizado resultou do incidente e dos processos de resposta e revisão do incidente, isso é outra coisa que deu certo.

Isso volta a um ponto anterior: temos tanto a aprender sobre como melhorar nossa capacidade de resposta, quanto sobre como evitar interrupções.

Prática 4: Mantenha as reuniões de revisão e planejamento separadas

Depois de resolver o incidente imediato, você naturalmente vai querer falar sobre itens de reparo e mitigação futura (e deveria), mas esses tópicos não devem fazer parte de sua reunião de revisão pós-incidente. Sua reunião de revisão pós-incidente tem um propósito, e permitir que a discussão de itens de reparo nessa reunião distrai desse propósito.

O melhor plano é discutir itens de reparo e problemas de planejamento em uma reunião separada um ou dois dias após a revisão pós-incidente. Você pode querer fazer isso com um grupo menor.

Isso ajudará de duas maneiras:

  • Ele irá ajudá-lo na revisão pós-incidente. É mais fácil evitar tirar conclusões precipitadas se você não estiver focado em como corrigi-lo.
  • Permitir um ou dois dias de imersão irá ajudá-lo a identificar os itens de reparação mais "energeticamente eficientes"; energia mínima para o máximo impacto. Seu subconsciente pode ajudá-lo; você só precisa dar tempo.