Resumo

Concluído

Neste módulo, abordámos a análise pós-incidente em profundidade. Esta é uma das nossas ferramentas mais poderosas para transformar incidentes com que todos nos deparamos em oportunidades para melhorar a nossa prática de operações. É uma parte fundamental para aumentar a nossa fiabilidade.

Explorámos alguns aspetos dos sistemas complexos que tornam os incidentes inevitáveis. Dada esta inevitabilidade, é relevante concentrarmo-nos não só na prevenção de catástrofes, mas também na forma como podemos responder a uma. Isto incentiva-nos a encontrar e utilizar ferramentas que podem ajudar a melhorar essa resposta como parte da fase de análise do ciclo de vida do incidente.

É aqui que entra a análise pós-incidente. Depois de ter uma boa noção do que é (e não é) uma revisão pós-incidente, além de seu propósito, nos certificamos de explorar as características e os componentes necessários para torná-la eficaz.

Em seguida, debatemos o processo e como começar a utilizar as ferramentas disponíveis no Azure.

Para melhorar as chances de sucesso, exploramos como evitar as armadilhas comuns em que as pessoas caem ao executar avaliações pós-incidente e algumas boas práticas que você pode usar para ajudar a tornar suas avaliações pós-incidente um sucesso retumbante.