Resumen
En este módulo, hemos analizado en profundidad la revisión posterior al incidente. Se trata de una de las herramientas más eficaces para convertir los incidentes que todos experimentamos en propulsores para mejorar los procedimientos operativos. Son esenciales para incrementar la confiabilidad.
Hemos explorado algunos de los aspectos de los sistemas complejos que hacen que los incidentes sean inevitables. Al ser inevitables, tiene su lógica que nos centremos no solo en tratar de evitar una catástrofe, sino también en cómo podemos responder ante una. Nos sirve de incentivo para buscar y usar herramientas que ayuden a mejorar esa respuesta como parte de la fase de análisis en el ciclo de vida de los incidentes.
Aquí es donde entra en juego la revisión posterior al incidente. Después de adquirir una idea adecuada de qué son las revisiones posteriores al incidente (y qué no lo es) y de cuál es su propósito, hemos procurado explorar sus peculiaridades y los componentes necesarios para que sean eficaces.
Tras ello, hablamos del proceso y cómo empezar a usar las herramientas disponibles en Azure.
Para mejorar las probabilidades de éxito, luego analizamos cómo evitar las trampas comunes en las que solemos caer al realizar revisiones posteriores al incidente, así como algunos procedimientos recomendados que podemos usar para que nuestras revisiones posteriores al incidente sean un rotundo éxito.