De Dickerson-hiërarchie van betrouwbaarheid

Voltooid

De kaart voor de Verbeter uw betrouwbaarheid leertraject is gebaseerd op een model uit de wereld van sitebetrouwbaarheidstechniek, de Dickerson-hiërarchie van betrouwbaarheid. Mikey Dickerson was een SRE die de oprichter van de United States Digital Services werd. Hij heeft deze hiërarchie gecreëerd terwijl hij een van de grootste betrouwbaarheidscrises ooit geconfronteerd heeft.

een diagram van een piramide met de zeven niveaus van de betrouwbaarheidshiërarchie.

Het model is gebaseerd op de hiërarchie van behoeften van Abraham Maslow, die de menselijke motivatie behandelt. Net als bij de hiërarchie van Maslow moet u ervoor zorgen dat elk van de lagere niveaus als eerste is aangepakt om de hiërarchie verder te verbeteren. De niveaus waarop we ons in dit leertraject richten, van beneden naar boven, zijn:

Bewaking

Dit niveau is de belangrijke basis waarop de andere niveaus rusten. Het is de bron van informatie waarmee u concrete gesprekken kunt voeren over betrouwbaarheid in uw organisatie rond objectieve gegevens. Wanneer u wijzigingen aanbrengt, is dit de manier waarop u het effect kent. In zelfs starker termen is deze praktijk hoe je weet of dingen beter of niet worden. Totdat u klaar bent met bewaking, kunt u de rest van het werk niet voltooien.

Reactie op incidenten

Elke productieomgeving heeft een storing van een bepaalde soort. Er is geen twijfel over dit feit. De vragen worden vervolgens 'wat doet u wanneer een incident optreedt?' Wat gebeurt er wanneer systemen niet beschikbaar zijn en klanten worden geraakt? U hebt een standaardproces nodig dat effectief is bij het prioriteren van het probleem, het inzetten van de juiste middelen en vervolgens het mitigeren van het probleem. Tegelijkertijd wilt u er ook voor zorgen dat u communiceert met belanghebbenden over het probleem.

Incidentbeoordeling (leren van fouten)

Dit proces stelt ons in staat om onze werkwijzen op te schalen door gezamenlijk de ervaring van elk belangrijk incident te onderzoeken, te beoordelen en te bespreken. Na incidentbeoordeling kunnen we leren van fouten en is van cruciaal belang voor betrouwbaarheidswerkzaamheden.

Testen/vrijgeven (implementatie)

Het volgende niveau hoger is gericht op onze test-, release- en implementatieprocessen. U kunt dit niveau beschouwen als 'Hoe goed bent u bij het maken van de systemen en processen die problemen kunnen ondervangen voordat ze incidenten veroorzaken?'

Capaciteitsplanning/-schaalaanpassing

Succes en de groei die ermee gepaard gaat, kan net zozeer een bedreiging voor betrouwbaarheid zijn als elk probleem met een systeem. Een klant kan het verschil niet zien tussen een systeem dat niet beschikbaar is omdat er een fout in de code is en een systeem dat niet kan worden verwerkt omdat het niet kan omgaan met de belasting van te veel personen die tegelijkertijd toegang proberen te krijgen. Dit niveau van de hiërarchie leidt ons ertoe om aandacht te besteden aan capaciteitsplanning en -schaalaanpassing als manieren om die bedreiging aan te pakken.

Dev-proces en gebruikerservaring

Er zijn nog twee niveaus in de hiërarchie die niet worden behandeld in de Verbeter uw betrouwbaarheid leertraject: het ontwikkelproces en het werk dat een goede gebruikerservaring (UX) oplevert. Deze twee onderwerpen worden niet besproken in de Uw betrouwbaarheid verbeteren leertraject, maar er zijn andere goede Learn-modules over deze onderwerpen beschikbaar.

We hebben een afzonderlijke Learn-module gemaakt voor elk niveau in de betrouwbaarheidshiërarchie. We hopen dat u deelneemt aan alle vijf de modules in dit leertraject.

Uw kennis controleren

1.

Wat is het eerste basisniveau in de Dickerson-hiërarchie van betrouwbaarheid?