Resumo

Concluído

Neste módulo, discutimos a revisão pós-incidente em profundidade. Esta é uma das nossas ferramentas mais poderosas para transformar os incidentes que todos experimentamos no combustível para melhorar a nossa prática de operações. É uma parte fundamental para aumentar a nossa fiabilidade.

Exploramos alguns dos aspetos de sistemas complexos que tornam os incidentes inevitáveis. Dada esta inevitabilidade, faz sentido concentrarmo-nos não só na tentativa de evitar uma catástrofe, mas também na forma como podemos responder a uma. Isso nos dá um incentivo para encontrar e usar ferramentas que podem ajudar a melhorar essa resposta como parte da fase de análise no ciclo de vida do incidente.

É aqui que entra em jogo a revisão pós-incidente. Depois de ter uma boa noção do que é (e não é) uma revisão pós-incidente, além de seu propósito, nos certificamos de explorar as características e os componentes necessários para torná-la eficaz.

Em seguida, veio uma discussão sobre o processo e como começar a usar as ferramentas disponíveis no Azure.

Para melhorar as chances de sucesso, exploramos como evitar as armadilhas comuns em que as pessoas caem ao executar avaliações pós-incidente e algumas boas práticas que você pode usar para ajudar a tornar suas avaliações pós-incidente um sucesso retumbante.