Resumen
En todas partes se producen incidentes. Cuando se ejecuta un sistema de prácticamente cualquier tamaño, en algún momento se producirá un error que causará una interrupción. Este es un hecho incontestable. Este es el motivo por el que Respuesta ante incidentes es el segundo nivel de la jerarquía de confiabilidad de Dickerson, justo después de la supervisión.
Por lo tanto, la pregunta es: ¿Cómo reaccionas en esos momentos? ¿Se responde con la mayor urgencia mediante un plan o un proceso establecidos, o bien se tiene una reacción ad hoc? Según sólidas investigaciones en el campo, el tiempo de recuperación es uno de los indicadores de una organización de alto rendimiento. El hecho de contar con un buen proceso de respuesta ante incidentes es crucial para reducir este período de recuperación.
En este módulo, hemos examinado las fases de un incidente y hemos explorado algunos de los componentes clave de un plan de respuesta ante incidentes para cada una de esas fases. Hemos analizado la importancia de poder realizar un seguimiento de incidentes correctamente y formas de automatizar ese proceso mediante las herramientas que proporciona Azure. Además, hemos analizado los aspectos clave de la comunicación durante un incidente. Por último, hemos explorado algunas de las herramientas que proporciona Azure, que pueden ayudar a la organización a ser más eficaz durante la corrección de un incidente.