Základy reakce na incidenty
V současné době mohou organizace využívat výhod usnadnění přístupu, efektivity a pohodlnosti, které jim přináší cloud, ale čelí mnoha výzvám souvisejícím s digitální transformací, která zahrnuje přesun částí jejich podnikání do cloudových služeb.
Mezi běžné výzvy, kterým může vaše organizace čelit, patří:
- Zvýšený počet přerušení služby
- Neexistence účinné metody sledování a reakce na incidenty (vše se děje náhodně a reakčně)
- Nepřijatelná doba řešení
- Doba řešení se nezlepšuje nebo se zhoršuje
- Informace a stav se hledají obtížně
- Opakující se stejné problémy a chyby
Abyste mohli tyto výzvy splnit, potřebujete dobře definovaný plán reakce na incidenty, který je založený na solidním základu.
Základy a pilíře
Účelem základu je držet a udržet pohromadě strukturu nad ním. V samostatném úvodním modulu tohoto studijního programu jsme představili myšlenku, že spolehlivost se vytváří na základní úrovni monitorování a že reakce na incidenty se nachází v hierarchii přímo nad ní.
Reakce na incidenty má také vlastní základ. Existují tři pilíře, které podporují dobrý plán reakce na incidenty:
- Seznamy
- Role
- Plány střídání
V této lekci zjistíte, co je každý z těchto pilířů a jaké části hrají při navrhování strategie reakce na incidenty, která vás dále posune směrem k vašim cílům spolehlivosti.
Seznamy
Je nezbytné mít dobrý plán, ale plán je bez použití bez lidí, aby ho provedli. Nejlepším místem, kde začít, je tedy určení, kdo by měl reagovat na problémy a jak jim dát vědět, kdy je jejich odpověď nutná.
Nejlepším způsobem, jak tuto výzvu vyřešit, je navrhnout seznam. Seznam je soupis osob, které jsou přiřazeny do pohotovostního týmu. Tento tým by mělo tvořit několik techniků. Tito členové týmu by měli mít znalosti a dovednosti k řešení typů problémů, ke kterým může dojít ve vašem prostředí, a také školení v reakci na incidenty.
Seznam jmen ale nestačí. Potřebujete vytvořit architekturu, která bude v libovolném okamžiku volat a co má každá osoba udělat. Tady přichází role.
Role
Role přinesou pořadí toho, co by bylo chaotické (nebo co nejlepší ad hoc) odpověď. To dělá tak, že definuje konkrétní funkce, které se mají předpokládat každou osobou v konkrétní situaci, a místem každého z nich v "řetězci příkazů". Role se můžou lišit podle organizace nebo i podle typu incidentu, ale následující role by měly být obecně součástí organizovaného týmu reakce na incidenty:
- Primární respondent: Jedná se o "bodovou osobu", která je obvykle první osobou na scéně. To znamená první technik na volání, který se volá, když dojde k incidentu.
- Sekundární respondent: Jedná se o někoho, kdo funguje jako záloha a může se přihlásit, pokud primární respondér není dostupný nebo pokud je potřeba druhý pár očí.
- Odborníci na danou problematiku(MSP): Jedná se o lidi, kteří mají podrobné znalosti o konkrétních omezujících okolnostech vašich operací. Jsou tam, pokud primární a sekundární respondenti potřebují eskalovat problém někomu s větší odborností. Nejsou neustále volané, ale jsou k dispozici, pokud jsou potřeba jejich specializované dovednosti. Měli byste udržovat seznam msp v různých tématech (například databáze, front-end, síťová infrastruktura, webové aplikace, kybernetická bezpečnost atd.).
- Velitel incidentu: Jedná se o důležitou roli v rozsáhlém incidentu nebo výpadku, který ovlivňuje mnoho různých komponent a/nebo vyžaduje koordinaci v mnoha různých týmech a systémech. Velitel incidentu bude osoba, která koordinuje spoustu konverzace a úsilí týkající se reakce a nápravné činnosti. Velitel incidentu sleduje "velký obraz"; mají přehled o tom, co se děje a kdo co dělá. Velitel incidentů je skvělý pro zajištění toho, aby technici zůstali zaměření a aby pracovali na vlastním úsilí o nápravu, aniž by museli pokračovat nebo vrátit zpět práci ostatních.
- Scribe: Role zapisovate je dokumentovat konverzaci kolem incidentu co nejpodrobněji. Týmy běžně používají telefonní mosty, konferenční hovory nebo video chat, aby se mohli všichni sejít a porozumět tomu, co se děje. Tady určitě může vzniknout prostor pro konverzaci. Je ale obtížné, abychom si prošli a podrobně porozuměli tomu, co technici říkali a dělali, pokud není přepisován. V důsledku toho je zapisovatel osoba, která nám může pomoct dokumentovat co nejvíce později. Zapisovatel zachycuje všechna možná data; nejen to, co dělají členové týmu, ale také to, co říkají, a dokonce i to, co cítí nebo prožívá.
- Komunikační koordinátor: Tuto osobu si můžete představit jako "manažera vztahů s veřejností" pro incident. Koordinátor komunikace spolupracuje s velitelem incidentu a sdílí informace o incidentu s těmi, kteří se aktivně nezabývá prací na řešení incidentu a zotavení z incidentu. To může zahrnovat zákazníky, prodejní a marketingové týmy, zákaznickou podporu a všechny další zúčastněné strany v rámci organizace nebo mimo ni, kteří potřebují vědět o tom, co se děje, a o stavu, jakým probíhá reakce a náprava.
Plány střídání
Nyní máte seznam pracovníků týmu reakce a přiřadili jste jim příslušné role. Dalším a posledním krokem je vytvoření plánu střídání, což je rozvrh, který přiřazuje směny, kdy jsou jednotlivé osoby v pohotovosti.
Existuje mnoho různých způsobů, jak směny rozdělovat. Plánování směn může být komplexním strategickým procesem. Směny by neměly být přiřazeny náhodně; měli byste se zamyslet nad plánováním, aby bylo co nejefektivnější a co nejpříjemnější pro členy týmu.
Mezi metody plánování směn patří:
- 24 x 7: Jedná se o rotaci, ve které členové týmu volají několik dní po sobě. Jedná se o jednoduchý způsob přidělení pokrytí směn, musíte být ale opatrní při omezování doby trvání. Rotace směn delší než tři až čtyři dny mohou mít negativní vliv na celkový stav technických pracovníků, a tím snižuje spolehlivost celého systému.
- Sledujte směny na slunci: Jedná se o model směn, ve kterém technici plánují směny na volání jenom během normální pracovní doby a pak oddají zodpovědnost za volání na konci pracovního dne jinému kolegovi, který se nachází v jiném časovém pásmu.
Toto je pouze pár příkladů možností, jak lze přiřazovat směny. Důležité je rozdělit směny takovým způsobem, který nejlépe vyhovuje jednotlivcům v týmu reakce. Existuje mnoho způsobů, jak přizpůsobit směny, zejména pro víkendy, když technici potřebují větší flexibilitu. Technici by měli být schopni roli snadno předat jiné osobě, když dojde ke konfliktům, které s prací nesouvisejí.