Kenmerken en levenscyclus van een incident

Voltooid

Zoals u in de laatste les hebt geleerd, is een incident een serviceonderbreking die van invloed is op uw klanten en eindgebruikers. Incidenten komen in veel vormen voor, variërend van prestatievertragingen die gebruikers frustreren ("traag is de nieuwe uitval") tot systeemcrashes waardoor de service of site gedurende een bepaalde periode volledig niet beschikbaar is.

Kenmerken van een incident

Incidenten zijn meestal onverwacht en lijken op het slechtst denkbare moment plaats te vinden (zoals om 2:00 uur 's nachts of wanneer u diep in een belangrijk project zit). Daarom worden incidenten vaak gevreesd en vermeden, zelfs tot op het punt waar mensen soms de betekenis van een incident afsluiden. Interne druk is soms zo groot in een organisatie dat er een verleiding bestaat om een onderbreking verkeerd te labelen of niet te melden uit angst voor een berisping.

Incidenten zorgen in ieder geval voor ongepland werk en omdat u de meeste tijd besteedt aan gepland werk met een goed idee van wat u zou moeten doen, denkt u waarschijnlijk aan incidenten als slechte dingen. Er is echter een andere manier om ernaar te kijken: incidenten zijn echt investeringen* in het leveren van de waarde die u wilt leveren aan eindgebruikers. Ongeacht de oorzaak van het incident of de omvang van de impact, hebben alle incidenten één ding gemeen: ze kunnen waardevolle leerervaringen bieden.

Beschouw incidenten als de hartslag van uw systemen. Ze vertellen je meer over het systeem dan je eerder hebt begrepen, en die kennis is een goede zaak. Wanneer u een sterke basis hebt voor bewaking en meer weet over wat er in uw systeem gebeurt, genereert het onvermijdelijk meer waarschuwingen en incidenten en mogelijkheden om te reageren. In ieder geval vertellen incidenten u wat er aan de hand is en vergroot u zo uw operationele bewustzijn. In een eerdere module over bewaking hebben we voorgesteld dat dit een belangrijke voorloper was van betrouwbaarheidswerk.

Levenscyclus van een incident

Als u de status van uw incidentresponsteam wilt uitbreiden naar 'elite/high performer', moet u verder kijken dan het idee van een serviceonderbreking of incident als een eenvoudige lineaire tijdlijn en deze vanuit een cyclisch perspectief benaderen.

U kunt de levenscyclus van een incident scheiden in afzonderlijke fasen die logisch na elkaar volgen in een cyclus die terugkeert naar het begin. Telkens wanneer u deze cyclus doorloopt (en u zult dit meerdere keren doen), als u deze correct verwerkt, is het mogelijk om terug te keren naar het begin met meer inzicht in uw systemen. Met wat opzettelijk werk kunt u ook beter voorbereid zijn om snel en effectief te reageren wanneer een incident zich de volgende keer voordoet.

Fasen van een incident

De afzonderlijke fasen van het incidentresponsproces zien er iets anders uit, afhankelijk van het model dat u gebruikt. Voor deze module zijn er vijf fasen die u doorloopt bij het reageren op een incident:

  • Detectie: in deze fase komt de bewakingskennis van een vorige module in dit leertraject aan bod. Uw bewakingshulpprogramma's verzamelen de gegevens uit logboeken, analyseren die informatie op basis van de klantgerichte doelstellingen die u hebt geconfigureerd en sturen u bruikbare waarschuwingen om u te laten weten dat menselijke tussenkomst nodig is.
  • Antwoord: deze fase gebeurt nadat u en uw team die waarschuwing hebben ontvangen. In deze module gaan we dieper in op deze fase, dus er is nog veel meer te zeggen over dit idee.
  • herstel: in deze fase herstelt u de systemen terug naar de normale functionaliteit. Hoe u dit doet, is afhankelijk van de oorzaak van de serviceonderbreking. Het herstellen en weer operationeel maken van de service voor uw klanten is uw hoogste prioriteit. Uw taak stopt echter niet zodra dat klaar is.
  • Analyse: Als u blijvende waarde wilt verkrijgen van incidenten, moet u hiervan leren. Deze fase is het proces van het verzamelen van de informatie over wat er is gebeurd en wanneer tijdens het incident en om te zien wat u ervan kunt leren door de juiste vragen te stellen. Er is een volledige module over leren van fouten waarmee deze fase wordt opgelost.
  • Gereedheid: U moet de lessen in de analysefase opnemen in uw operationele praktijk. Als er actie-items zijn die in de toekomst zouden helpen een vergelijkbare storing te voorkomen, zouden ze ook deel uitmaken van deze fase.

cyclusdiagram van cirkels die zijn gelabeld met fasen van bovenaf. Cirkels zijn verbonden met de volgende cirkel met pijlen van fase naar fase.

Voordat u een plan voor incidentrespons maakt, moet u de kenmerken en waarde van incidenten begrijpen en bekend zijn met de fasen van de levenscyclus van het incident. De volgende stap is ervoor te zorgen dat uw reactiestrategie is gebouwd op een solide basis.

Uw kennis controleren

1.

Welke van deze kan worden beschouwd als de "pulse" van uw systeem?

2.

Welke van deze is geen fase van een incident?