Práticas úteis para aprender com as falhas
Agora que você está ciente de algumas das armadilhas comuns que podem sabotar ou, pelo menos, limitar o valor que você pode obter de suas avaliações pós-incidente, a próxima pergunta lógica é "o que você deve fazer em vez disso?"
Nesta unidade, você aprenderá quatro práticas úteis que podem melhorar o processo de análise pós-incidente.
Prática 1: Executar uma revisão pós-incidente facilitada
Você já sabe que uma revisão pós-incidente não é um documento ou relatório — idealmente é uma conversa — então segue-se que apenas ter uma única pessoa escrevendo um "post mortem" do que aconteceu sem qualquer discussão não faz uma revisão pós-incidente útil. Independentemente do nível de conhecimento ou de participação que essa pessoa tenha em relação ao incidente, muito pouco se aprenderá se for tido em conta apenas um ponto de vista.
O primeiro passo é reunir todas as pessoas envolvidas no incidente ao mesmo tempo. Muitas vezes, é útil ter um facilitador nessa reunião que possa ajudar a orientar a discussão. Idealmente, esse facilitador deve ser alguém "neutro" que não tenha participado do incidente. Todos aprenderão mais se o facilitador não parecer ter ideias preconcebidas ou uma agenda pessoal ao contar a história do incidente.
O formato exato da reunião dependerá da sua equipa, do agendamento e da natureza do incidente, mas eis algumas diretrizes básicas:
- Reuniões, não maratonas: as reuniões não precisam ser longas. Geralmente, a maioria das pessoas consegue concentrar-se totalmente e participar eficazmente entre 60 e 90 minutos, por isso, limite a reunião a um período não superior a este.
- Preparação pré-reunião: Para aproveitar melhor o tempo da reunião, pode ser útil para o facilitador se preparar, conduzindo entrevistas individuais com alguns dos membros da equipe de resposta para obter uma visão geral do incidente e ideias sobre quais tópicos discutir na reunião. As entrevistas individuais podem ser reportadas ao grupo se houver preocupação com questões interpessoais ou personalidades que dificultem a reunião (ou se os indivíduos não se sentirem confortáveis em se apresentar na frente da sala por qualquer motivo).
- Não é obrigatório para todos os incidentes: este é um processo de aprendizagem, e você está "aprendendo a aprender", então comece pequeno. Você não precisa fazer isso para todos os incidentes. Pode escolher. Pode querer começar com incidentes mais pequenos ou começar com uma reunião de análise apenas uma vez por mês.
A reunião de revisão pós-incidente é uma oportunidade para descobrir o que deu errado, o que foi feito certo e como você pode lidar melhor com falhas no futuro. O objetivo final é melhorar a fiabilidade.
Prática 2: Faça perguntas melhores
Já sabe que a linguagem é importante e, na análise pós-incidente, isso aplica-se especialmente às perguntas que faz. Fazer perguntas objetivas geralmente suscita respostas mais úteis.
Em particular, é melhor perguntar às pessoas "como" ou "o quê" em vez de "por quê".
Quando se pede às pessoas que expliquem "por que" fizeram algo ou "por que" algo aconteceu, isso tende a colocá-las na defensiva. Começar uma pergunta com "porquê" muitas vezes surge como um julgamento, crítica ou acusação. Isso força as pessoas a justificar suas ações, e as pessoas nem sempre sabem por que fizeram algo ou por que algo aconteceu como resultado de suas ações. Também pode levar as pessoas a saltar diretamente para a causa ou a conclusão de um problema, ignorando uma grande quantidade de informações que poderiam ser debatidas. Por exemplo, se você perguntar "por que o sistema parou de funcionar?", a resposta pode ser "Porque o disco encheu". Isso ignora questões importantes como "como você notou que havia um problema com o disco?" ou até mesmo "qual foi a primeira coisa que você verificou no sistema, o que o levou a verificá-lo?"
Isso não significa que você não possa explorar os fatores que contribuem para o incidente ou o raciocínio que uma pessoa usou para decidir o que fazer em resposta a eles, significa apenas que você deve prestar atenção em como você formula essas perguntas:
Não pergunte "por que você fez isso?"
Em vez disso, pergunte "o que levou em conta sua decisão de fazer essa mudança?"
Não pergunte "por que isso não foi pego no canário?"
Em vez disso, pergunte "quão eficaz é o canário em pegar esse tipo de problema, geralmente?"
Lembre-se de que a análise pós-incidente serve para aprender. É provável que cada participante no incidente tenha uma visão ligeiramente diferente dos acontecimentos. Você aprenderá mais se fizer perguntas que exponham essas múltiplas visões e interpretações.
Muitas vezes, você aprenderá tanto perguntando sobre como o trabalho "normalmente" acontece quanto perguntando sobre o incidente específico.
Para saber mais sobre como fazer melhores perguntas, consulte este recurso:
The Etsy Debriefing Facilitation Guide
Prática 3: Pergunte como as coisas correram bem
Quando você pensa em aprender com o fracasso, você pode esquecer que, mesmo dentro de uma grande interrupção ou outro incidente, além das coisas que dão errado, também há coisas que dão certo. Longe da nossa visão dos incidentes como sendo pontuais ou produtos de condições extremas, na maioria dos sistemas complexos, as coisas correm mal por muitas das mesmas razões pelas quais correm bem.
É da natureza humana focar suas perguntas no lado negativo da equação. No entanto, fazer perguntas sobre como as coisas correram bem irá também fornecer-lhe informações que não teria obtido de outra forma.
Não pergunte apenas como a interrupção aconteceu, pergunte também sobre como você se recuperou.
Vai querer saber quais foram as informações, ferramentas, competências e pessoas que ajudaram no esforço de recuperação. Essas são coisas que você quer ser capaz de reproduzir, então essas informações são valiosas para planejar o que fazer daqui para frente.
Neste contexto, queremos perguntar como é que as pessoas souberam o que sabiam e no que basearam as suas decisões. Houve um momento crítico em que alguém partilhou alguma informação que ajudou a descobrir o que estava a acontecer? Como é que sabiam fazer isso? De onde veio a informação?
Procure temas e padrões. Por fim, como parte do reconhecimento do que deu certo, pergunte: "O que você sabe agora que não sabia antes?" Se o aprendizado resultou do incidente e dos processos de resposta e revisão do incidente, isso é outra coisa que deu certo.
Esta informação faz alusão a um ponto anterior: temos tanto a aprender sobre como melhorar a nossa capacidade de resposta, como sobre prevenir falhas.
Prática 4: Mantenha as reuniões de revisão e planejamento separadas
Depois de resolver o incidente imediato, você naturalmente vai querer falar sobre itens de reparo e mitigação futura (e deveria), mas esses tópicos não devem fazer parte da sua reunião de revisão pós-incidente. Sua reunião de revisão pós-incidente tem um propósito, e permitir que a discussão de itens de reparo nessa reunião distrai desse propósito.
O melhor plano é analisar os itens de reparação e os problemas de planeamento noutra reunião, um ou dois dias após a sua análise pós-incidente. É recomendável fazê-lo com um grupo mais pequeno.
Isto irá ajudar de duas formas:
- Ele irá ajudá-lo na revisão pós-incidente. É mais fácil evitar conclusões precipitadas se não estiver concentrado em arranjar uma forma de o resolver.
- Permitir um ou dois dias de imersão irá ajudá-lo a identificar os itens de reparação mais "energeticamente eficientes"; energia mínima para o máximo impacto. Seu subconsciente pode ajudá-lo; você só precisa dar tempo.