¿Qué es una revisión posterior al incidente?
Ya lo hemos visto en un módulo anterior de esta ruta de aprendizaje, pero a modo de recordatorio rápido, este es el ciclo de vida de los incidentes:
Un incidente pasa por las siguientes fases:
- Detección: Detección: cuando nos damos cuenta de que hay un problema (lo ideal es que el sistema de supervisión advierta de ello antes de que un cliente lo notifique o se queje).
- Respuesta: Nos ponemos en marcha, iniciamos nuestro proceso de respuesta a incidentes, intentamos evaluar la situación y respondemos con premura.
- Corrección: Trabajamos para averiguar cuál es el problema y para volver a poner el sistema o el servicio de vuelta en funcionamiento.
- Análisis: Después del incidente, intentamos aprender de la experiencia, viendo quizá qué cosas convendría cambiar en el sistema o en nuestro proceso.
- Preparación: Hacemos cambios según lo aprendido para mejorar nuestra confiabilidad y el contexto (procesos, etc.) en torno a ella.
El tema de este módulo tiene lugar en gran medida durante la fase de análisis. Aprendemos de los incidentes llevando a cabo una revisión posterior al incidente.
Debemos realizar una revisión posterior al incidente tras cada incidente significativo.
Aunque la revisión formal tiene lugar después de las fases de respuesta y corrección, comenzaremos a preparar la fase de análisis en cuanto recibamos una alerta accionable que nos indique que se ha producido un incidente, informaremos a los miembros del equipo e iniciaremos una conversación en torno al incidente.
Definición de la revisión posterior al incidente
No siempre se usa exactamente la misma terminología para hacer referencia a este proceso. Algunas personas lo llaman:
- Revisión posterior al incidente
- Revisión de aprendizaje posterior al incidente
- Autopsia
- Retrospectiva
En este módulo, usaremos el término "revisión posterior al incidente".
Además, no todo el mundo lleva a cabo esta revisión exactamente de la misma manera. Por ejemplo, muchos comienzan reuniendo en una sala a todos los que tengan algún tipo de conexión con el incidente, mientras que otros optan por crear la revisión realizando entrevistas individuales y, luego, informando al resto del grupo.
Este último método suele funcionar mejor cuando la disposición de los grupos dentro de la organización dificulta reunirlos a todos en una misma sala. Por ejemplo, si las dinámicas, las personalidades y la naturaleza distribuida de un equipo repartido por distintas zonas horarias dificultan ese tipo de reunión, puede que sea más fácil trabajar en la revisión de otro modo. Deberemos hacer lo que mejor se adapte a nuestro equipo y a las circunstancias.
Independientemente de cómo lo llamemos u organicemos, existen tres puntos clave:
- Debemos intentar incluir en la revisión posterior al incidente a todos los usuarios implicados en la respuesta al incidente. Incluir todas estas voces es importante, porque cada persona tendrá puntos de vista y recuerdos distintos del mismo evento.
- Debemos realizar la revisión posterior al incidente en las 24 o 36 horas siguientes al evento, si es posible. La neurociencia ha confirmado que la memoria humana es célebre por su escasa confiabilidad. Olvidamos rápidamente las cosas. Cuanto más tiempo pase tras un evento, menos específicos y detallados serán los recuerdos.
- Una revisión posterior al incidente no debe ser acusatoria. Hablaremos más al respecto en la siguiente unidad.
Objetivo de la revisión posterior al incidente
El objetivo de una revisión posterior al incidente es que el equipo aprenda y mejore. Resulta muy adecuado conocer los sistemas y todo aquello que hemos intentado hacer que ha funcionado o que no, ya que ello nos permitirá mejorar.
Al mismo tiempo, conviene recordar que los elementos de acción que elaboremos (informes, tareas, informes de errores, vales y comentarios) son útiles, pero son accesorios al proceso: lo importante es aprender y mejorar. Confeccionar una lista de elementos de acción es, en el mejor de los casos, un objetivo secundario.