Komunikace a spolupráce

Dokončeno

Včasné a jasné sdílení informací je základním prvkem efektivní reakce na incidenty v průběhu celého životního cyklu reakce na incidenty. Komunikace má význam během každé fáze:

  • detekce: Informujte správné osoby, že došlo k incidentu, a sdělte jim obecnou povahu/závažnost incidentu a jeho dopad.
  • odpovědi: Sdělte podrobnosti o incidentu během procesu diagnostiky, jaké kroky jsou potřeba k vyřešení problému a kdo má co dělat.
  • Náprava: Informujte, jak a kdy byla služba obnovena do normálního provozu a nezbytných následných akcí.
  • analýza: Komunikujte poznatky získané z incidentu a co je možné udělat, aby se zabránilo jeho dalšímu vzniku.
  • připravenosti: Sdělte změny (nebo požadované změny) plánu reakce na incidenty, našich postupů a našich systémů, které vyplynuly z poznatků získaných z tohoto incidentu.

Stanovení priority pro jasnou komunikaci

Dříve v tomto modulu jsme zmínili, že elitní/vysoce výkonné organizace používají proaktivní přístup místo reaktivního přístupu. Změna stavu od reakce na efektivní reakci na incidenty je vedlejším produktem stanovení priority a zajištění dobré, jasné a přesné komunikace.

Mezi klíče pro stanovení priority pro jasnou komunikaci patří:

  • Ujistěte se, že sdílíte informace o tom, co se děje v jednotlivých krocích cesty.
  • Zdokumentujte informace; vložte ho do psaní tak, aby bylo méně pravděpodobné, že by bylo špatně pochopeno nebo zapomenuto.
  • Umístěte informace do centralizovaného umístění, kde budou přístupné všem uživatelům, kteří je potřebují.
  • Používejte nástroje ke zvýšení účinnosti komunikace.

I když jsme to v té době nezmínili, toto jsou všechny chování, která jsme projevovali v předchozí části.

Komunikační nástroje: ChatOps

Než budete moct mluvit o komunikačních nástrojích, musíte se dozvědět o ChatOps, což není konkrétní nástroj, ale model spolupráce řízený konverzací. Je oblíbená pro vývojáře, kteří spojují lidi, nástroje, procesy a automatizaci. ChatOps nabízí nový a lepší způsob, jak týmy pracovat, využívat skupinový chat místo toho, aby se spoléhaly na starší technologie, jako je e-mail ke spolupráci.

V pokročilé podobě může ChatOps k automatizaci práce používat přizpůsobené roboty a umělou inteligenci. V kontextu reakce na incidenty můžete pomocí ChatOps přenést do konverzace nástroje skupinového chatu. Práce tímto způsobem může výrazně incentivizovat techniky, aby se spojili v skupinovém chatu a spolupracovali na problémech a incidentech a také na normálním technickém úsilí.

Skupinová konverzace vám pomůže sdílet další informace o tom, co se děje ve vašem systému z hlediska institucionálních znalostí, a získá tyto informace z hlavy lidí a do chatu, aby je mohli sdílet a používat ostatní.

To zvyšuje viditelnost a informovanost o provozu v celém týmu a pomáhá ostatním naučit se, jak dělat, co mají dělat. Když spouštíte příkazy a sdílíte to, co děláte v chatu, učíte ostatní, co dělat a jak to udělat.

Učení je vedlejším produktem sdílení dalších informací o tom, co se děje v rámci inženýrství. Když pochopíte více o tom, co dělají vaši kolegové, spolupracovníci a vedení , včetně toho, jak dělají rozhodnutí, můžete být více empatičtí ohledně toho, co se děje. Všechno se děje přirozeněji, když začnete přesouvat svou práci do chatu.

Použití Microsoft Teams v řešení ChatOps

Už jste se dozvěděli, jak může být Microsoft Teams důležitou součástí komunikační sady nástrojů během incidentu. Můžete vytvořit konverzační most s kanálem věnovaným incidentu a dokonce použít Logic Apps k automatizaci publikování podrobností incidentu přímo do kanálu.

Vzhledem k tomu, že Microsoft Teams je centralizované místo, kde máme mnoho konverzací o našem technickém úsilí, je vhodné začít v řešení ChatOps za účelem poskytování aktualizací stavu a dalšího kontextu.

K aktualizaci stavové stránky můžete například použít webhook z Teams. Aplikaci Teams můžete nakonfigurovat tak, aby v chatu naslouchala určitému příkazu a pokud byla přijata, odeslala žádost do jiné aplikace. Tato jednoduchá aplikace může být funkce Azure Functions, která aktualizuje statickou stránku HTML uloženou ve službě Azure Blob Storage s informacemi o probíhajícím incidentu. Konečným výsledkem je, že jednoduchý příkaz v chatu poskytuje aktualizaci dalších zúčastněných stran, které nejsou v chatu. Tento jednoduchý krok šetří čas, který by jinak mohl být stráven aktualizací těch, kteří nejsou součástí odpovědi.

Zatím jsme do značné míry strávili čas tím, že se podíváme na fáze před nápravou. Teď se zaměříme na způsoby zlepšení této fáze.