Mejora de la confiabilidad con procedimientos operativos modernos: aprender de los errores

Principiante
Administrador
Ingeniero de DevOps
Arquitecto de soluciones
Administrador de tecnología
Azure

Habrá incidentes, de eso no cabe la menor duda. la cuestión clave aquí es si esos incidentes se van a afrontar como una oportunidad de aprendizaje para mejorar los procedimientos operativos o, simplemente, como una pérdida de tiempo, dinero y reputación. Veremos cómo aprender de los errores y las herramientas de Azure que nos pueden servir para mejorar los procedimientos operativos.

Objetivos de aprendizaje

En este módulo, aprenderá a:

  • Descubrir la importancia de aprender de los incidentes.
  • Conocer los aspectos de los sistemas complejos que hacen que aprender de los errores sea importante.
  • Saber cuándo y cómo realizar una revisión posterior al incidente.
  • Conocer la finalidad y las metas de una revisión posterior al incidente.
  • Saber cuáles son los componentes que conforman una buena revisión posterior al incidente.
  • Explorar las herramientas de Azure que nos pueden ayudar a empezar a usar revisiones posteriores al incidente.
  • Conocer las trampas comunes que deben evitarse.
  • Identificar los procedimientos útiles para realizar una revisión mejor.

Requisitos previos

None