Komunikace a spolupráce
Včasné a jasné sdílení informací je základním prvkem efektivní reakce na incidenty v průběhu celého životního cyklu reakce na incidenty. Komunikace je důležitá v každé fázi:
- Detekce: Komunikujte se správnými lidmi, ke kterým došlo k incidentu, a široké povaze a závažnosti incidentu a dopadu.
- Odpověď: Sdělte podrobnosti o incidentu během procesu diagnostiky, jaké kroky jsou potřeba k vyřešení problému a kdo má co dělat.
- Náprava: Komunikujte o tom, jak a kdy byla služba obnovena do normálního provozu a nezbytných následných akcí.
- Analýza: Komunikujte poznatky získané z incidentu a co je možné udělat, abyste zabránili tomu, aby se znovu stalo.
- Připravenost: Komunikujte změny (nebo požadované změny) plánu reakce na incidenty, naše postupy a naše systémy, které byly výsledkem poznatků získaných z tohoto incidentu.
Stanovení priorit pro jasnou komunikaci
Dříve v tomto modulu jsme zmínili, že elitní/vysoce výkonné organizace používají proaktivní přístup místo reaktivního přístupu. Posun od reaktivního přístupu k efektivním reakcím na incidenty je vedlejším produktem stanovení priorit a umožňuje dobrou, jasnou a přesnou komunikaci.
Toto zásady jsou pro stanovení priorit klíčové:
- Ujistěte se, že sdílíte informace o tom, co se v každém kroku procesu děje.
- Zdokumentujte informace; vložte ho do psaní tak, aby bylo méně pravděpodobné, že by bylo špatně pochopeno nebo zapomenuto.
- Umístěte informace do centralizovaného umístění, kde k nim budou mít přístup všichni, kdo je potřebují.
- Používejte nástroje pro zlepšení efektivity a komunikace.
Jedná se o chování, které jsme si předvedli v poslední lekci, i když jsme je tak nepojmenovali.
Komunikační nástroje: ChatOps
Než budete moct mluvit o komunikačních nástrojích, musíte se dozvědět o ChatOps, což není konkrétní nástroj, ale model spolupráce řízený konverzací. Je oblíbená pro vývojáře, kteří spojují lidi, nástroje, procesy a automatizaci. ChatOps nabízí nový a lepší způsob pro práci týmů, využívá skupinový chat a při spolupráci pak není nutné spoléhat na starší technologie, jako je například e-mail.
V rozšířené podobě může ChatOps používat přizpůsobené roboty a umělou inteligenci a automatizovat práci. V kontextu reakce na incidenty můžete pomocí ChatOps přenést do konverzace nástroje skupinového chatu. Práce tímto způsobem může výrazně incentivizovat techniky, aby se spojili v skupinovém chatu a spolupracovali na problémech a incidentech a také na normálním technickém úsilí.
Skupinová konverzace vám pomůže sdílet další informace o tom, co se děje ve vašem systému z hlediska institucionálních znalostí, a získá tyto informace z hlavy lidí a do chatu, aby je mohli sdílet a používat ostatní.
To zvyšuje viditelnost a informovanost o provozu v celém týmu a pomáhá ostatním naučit se, jak dělat, co mají dělat. Když spouštíte příkazy a sdílíte to, co děláte v chatu, učíte ostatní, co dělat a jak to udělat.
Učení je vedlejším produktem sdílení dalších informací o tom, co se děje v rámci technického inženýrství. Když pochopíte více o tom, co dělají vaši kolegové, spolupracovníci a vedení , včetně toho, jak dělají rozhodnutí, můžete být více empatičtí ohledně toho, co se děje. Všechno tohle se bude dít přirozeněji, když začnete práci přesouvat do chatu.
Použití aplikace Microsoft Teams v řešení ChatOps
Už jste zjistili, že aplikace Microsoft Teams může být v době incidentu důležitou součástí vaší sady komunikačních nástrojů. Můžete vytvořit konverzační most s kanálem věnovaným incidentu a dokonce použít Logic Apps k automatizaci publikování podrobností incidentu přímo do kanálu.
Vzhledem k tomu, že Microsoft Teams je centralizované místo, kde máme mnoho konverzací o našem technickém úsilí, je vhodné začít v řešení ChatOps za účelem poskytování aktualizací stavu a dalšího kontextu.
Například můžete použít webhook z aplikace Teams a aktualizovat stavovou stránku. Aplikaci Teams můžete nakonfigurovat tak, aby v chatu naslouchala určitému příkazu a pokud byla přijata, odeslala žádost do jiné aplikace. Tato jednoduchá aplikace může být funkce Azure Functions, která aktualizuje statickou stránku HTML uloženou ve službě Azure Blob Storage s informacemi o probíhajícím incidentu. Konečným výsledkem je, že jednoduchý příkaz v chatu zajišťuje aktualizaci dalších zúčastněných stran, které nejsou účastníky chatu. Tento jednoduchý krok šetří čas, který by jinak mohl být stráven aktualizací těch, kteří nejsou součástí odpovědi.
Zatím jsme do značné míry strávili čas tím, že se podíváme na fáze před nápravou. Teď se zaměříme na způsoby zlepšení této fáze.