Comunicación y colaboración
La información clara y puntual es un elemento esencial para responder de forma eficaz a los incidentes, a lo largo de todo el ciclo de vida de la respuesta ante incidentes. La comunicación es importante en todas las fases:
- Detección: Comunique a las personas adecuadas que se ha producido un incidente e informe sobre la naturaleza general o la gravedad del incidente y su impacto.
- Respuesta: Comunique los detalles del incidente a medida que evolucione el proceso de diagnóstico, los pasos necesarios para solucionar el problema y quién se encargará de cada tarea.
- Corrección: Comunique cómo y cuándo se restauró el servicio al funcionamiento normal y las acciones de seguimiento necesarias.
- Análisis: Comunique lo que se ha aprendido del incidente y lo que se puede hacer para evitar que vuelva a suceder.
- Preparación: Comunique los cambios que se han introducido (o que deberían introducirse) en el plan de respuesta ante incidentes, los procedimientos y los sistemas como consecuencia de lo aprendido tras el incidente.
Priorización de la comunicación clara
Anteriormente en este módulo mencionamos que las organizaciones de élite o rendimiento alto adoptan un enfoque proactivo, en lugar de reactivo. Una de las consecuencias de priorizar y permitir la comunicación abierta, clara y precisa es que se deja de reaccionar a los incidentes y se pasa a responder ante ellos de forma eficaz.
Estas son algunas de las claves para priorizar la comunicación clara:
- Asegúrese de compartir información sobre lo que ocurre en cada paso del proceso.
- Documente la información y póngala por escrito para reducir al mínimo la probabilidad de malinterpretarla u olvidarla.
- Coloque la información en una ubicación centralizada a la que puedan acceder todos los usuarios que la necesiten.
- Use herramientas para aumentar la eficacia de las comunicaciones.
Aunque no insistimos en esta cuestión en su momento, todos estos comportamientos se mostraron en la última unidad.
Herramientas de comunicación: ChatOps
Antes de centrarse en las herramientas de comunicación, debe familiarizarse con ChatOps. No es una herramienta específica, sino un modelo de colaboración orientado a la conversación. Se trata de un recurso popular entre los desarrolladores para combinar usuarios, herramientas, procesos y automatización. ChatOps ofrece una forma nueva y mejor para el trabajo en equipo que aprovecha los chats de grupo para la colaboración, en lugar de basarse en tecnologías antiguas, como el correo electrónico.
En su forma avanzada, ChatOps puede usar bots personalizados e inteligencia artificial para automatizar el trabajo. En el contexto de la respuesta ante incidentes, puede usar ChatOps para usar herramientas de chat de grupo en la conversación. Al trabajar de esta manera, se puede incentivar a los ingenieros a reunirse en un chat de grupo y colaborar en los problemas y los incidentes, así como en los esfuerzos de ingeniería normales.
Los chats de grupo ayudan a compartir más detalles sobre lo que sucede en el sistema en términos de conocimiento institucional y canalizan esta información de las mentes de las personas al chat para que otros puedan compartirla y usarla.
Esto aumenta la visibilidad y el conocimiento de las operaciones en el equipo y ayuda a otras personas a aprender lo que se supone que deben hacer. Cuando ejecuta comandos y comparte lo que hace en el chat, está enseñando a los demás lo que deben hacer y cómo.
El aprendizaje es un subproducto que se deriva del proceso de compartir lo que sucede en ingeniería. Cuando conozca mejor lo que hacen y piensan sus colegas, compañeros de trabajo y jefes (incluida la manera en que toman decisiones), se sentirá más identificado con lo que está ocurriendo. Todo esto sucederá de forma más natural cuando empiece a trabajar con un chat.
Uso de Microsoft Teams en la solución de ChatOps
Ya ha aprendido que Microsoft Teams puede ser una parte importante de las herramientas de comunicación durante un incidente. Puede crear un puente de conversación con un canal dedicado al incidente, e incluso usar Logic Apps para automatizar la publicación de los detalles del incidente directamente en el canal.
Puesto que Microsoft Teams es un espacio centralizado en el que tienen lugar muchas conversaciones sobre los esfuerzos de ingeniería, es un buen punto de partida en la solución de ChatOps para proporcionar actualizaciones de estado y contexto adicional.
Por ejemplo, puede usar un webhook de Teams para actualizar una página de estado. Teams se puede configurar de modo que escuche un comando determinado en un chat y, si lo recibe, envíe una solicitud a otra aplicación. Esta aplicación sencilla podría ser una instancia de Azure Functions que actualiza una página HTML estática almacenada en Azure Blob Storage con información sobre el incidente en curso. El resultado final es que ese sencillo comando del chat permite poner al día a otras partes interesadas que no están en el chat. Este sencillo paso ahorra un tiempo que, de otro modo, podría desperdiciarse en mantener al corriente a las personas que no participan en la respuesta.
Hasta ahora, hemos dedicado mucho tiempo a examinar las fases antes de la corrección. Ahora vamos a cambiar nuestro enfoque a formas de mejorar esa fase.