Kommunikation och samarbete
Information om delning i tid och tydlig information är en viktig del av att effektivt svara på incidenter under hela livscykeln för incidenthantering. Kommunikation är viktig under varje fas:
- Identifiering: Kommunicera till rätt personer om att en incident har inträffat och incidentens breda karaktär/allvarlighetsgrad och påverkan.
- Svar: Förmedla information om incidenten när diagnostikprocessen fortsätter, vilka steg som krävs för att åtgärda problemet och vem som ska göra vad.
- Reparation: Kommunicera hur och när tjänsten har återställts till normal drift och nödvändiga uppföljningsåtgärder.
- Analys: Förmedla lärdomarna från incidenten och vad som kan göras för att förhindra att det händer igen.
- Beredskap: Kommunicera ändringar (eller nödvändiga ändringar) i planen för incidenthantering, våra procedurer och våra system som är resultatet av lärdomarna från den här incidenten.
Prioritera för tydlig kommunikation
Tidigare i den här modulen nämnde vi att elit-/högpresterande organisationer har en proaktiv snarare än reaktiv metod. Att byta inställning från att reagera till att på ett effektivt sätt hantera incidenter kommer som en biprodukt när du prioriterar och använder bra, tydlig och korrekt kommunikation.
Bland nycklarna för att prioritera tydlig kommunikation finns:
- Se till att du delar information om vad som händer varje steg på vägen.
- Dokumentera informationen; skriv det skriftligt så att det är mindre sannolikt att bli missförstådd eller bortglömd.
- Placera informationen på en central plats där den kommer att vara tillgänglig för alla som behöver den.
- Använd verktyg för att göra kommunikationen effektivare.
Även om vi inte uppmärksammade det så är de samtliga beteenden som vi visade i den senaste enheten.
Kommunikationsverktyg: ChatOps
Innan du kan prata om kommunikationsverktyg måste du lära dig mer om ChatOps, som inte är ett specifikt verktyg, utan en konversationsdriven samarbetsmodell. Det är populärt bland utvecklare för att sammanföra människor, verktyg, processer och automatisering. ChatOps ger dig ett nytt och bättre sätt för team att arbeta på och använder gruppchattar istället för att lita på äldre tekniker som e-post för att samarbeta.
I sin avancerade form kan ChatOps använda anpassade robotar och artificiell intelligens för att automatisera arbete. När det gäller incidenthantering kan du använda ChatOps för att föra in gruppchattverktyg i konversationen. Att arbeta på det här sättet kan starkt uppmuntra ingenjörer att träffas i gruppchatt och samarbeta om problem och incidenter samt normala tekniska insatser.
Gruppchatt hjälper dig att dela mer om vad som händer i systemet när det gäller institutionell kunskap och får den informationen ur människors huvuden och i chatten så att den kan delas och användas av andra.
Detta ökar synligheten och driftsmedvetenheten i hela teamet och hjälper andra att lära sig att göra vad de ska göra. När du kör kommandon och delar med dig av det du gör i chatten lär du andra vad de ska göra och hur de gör det.
Inlärning är en biprodukt av att dela mer om vad som händer inom teknik. När du förstår mer om vad dina kollegor, medarbetare och ledarskap gör och tänker – inklusive hur de fattar beslut – kan du vara mer empatisk om vad som händer. Allt detta händer mer naturligt när du börjar flytta arbetet till chattar.
Använd Microsoft Teams i din ChatOps-lösning
Du har redan lärt dig hur Microsoft Teams kan utgöra en viktig del av din verktygslåda för kommunikation under en incident. Du kan skapa en konversationsbrygga med en kanal som ägnas åt incidenten och till och med använda Logic Apps för att automatisera publiceringen av incidentinformationen direkt i kanalen.
Eftersom Microsoft Teams är en central plats där vi har många konversationer om våra tekniska insatser är det en bra plats att börja i din ChatOps-lösning för att tillhandahålla statusuppdateringar och ytterligare kontext.
Du kan till exempel använda en webhook från Teams för att uppdatera en statussida. Du kan konfigurera Teams att lyssna efter ett visst kommando i en chatt och skicka en begäran till ett annat program om det tas emot. Det enkla programmet kan vara en Azure-funktion som uppdaterar en statisk HTML-sida som lagras i Azure Blob Storage med information om den pågående incidenten. Slutresultatet är att det enkla kommandot i chatten ger en uppdatering för fler intressenter som inte är med i chatten. Det här enkla steget sparar tid som annars kan ägnas åt att uppdatera dem som inte ingår i svaret.
Hittills har vi till stor del ägnat vår tid åt att titta på faserna före reparationen. Nu ska vi flytta fokus till sätt att förbättra den fasen.