Dickerson-hierarkin för tillförlitlighet

Slutförd

Kartan för utbildningsvägen Förbättra din tillförlitlighet baseras på en modell från den tekniska världen för platstillförlitlighet som kallas Dickerson-hierarkin för tillförlitlighet. Mikey Dickerson var en SRE som blev grundare av United States Digital Services. Han skapade den här hierarkin samtidigt som han stod inför en av de största tillförlitlighetskriserna någonsin.

ett diagram över en pyramid som visar de sju nivåerna i hierarkin för tillförlitlighet.

Modellen är mönstrad efter Abraham Maslows hierarki av behov, som tar upp mänsklig motivation. Precis som med Maslows hierarki måste du se till att var och en av de lägre nivåerna har åtgärdats först för att gå vidare uppåt i hierarkin. De nivåer som vi fokuserar på i den här utbildningsvägen, nedifrån och upp, är:

Övervakning

Den här nivån är den viktiga grund som de andra nivåerna vilar på. Det är källan till information som gör att du kan ha konkreta konversationer om tillförlitlighet i din organisation kring objektiva data. När du gör ändringar är den här metoden hur du känner till effekten. I ännu skarpare termer är denna praxis hur du vet om saker och ting blir bättre eller inte. Du kan inte få resten av arbetet gjort förrän du är stabil när det gäller övervakning.

Incidenthantering

Varje produktionsmiljö har ett avbrott av något slag. Det går inte att bestrida det här faktumet. Frågorna blir sedan "vad gör du när en incident inträffar? Vad händer när systemen är nere och kunderna påverkas?" Du behöver en standardprocess som är effektiv för att minimera problemet, få rätt resurser engagerade och sedan åtgärda problemet. Samtidigt vill du också se till att du kommunicerar med intressenter om problemet.

Granskning efter incident (inlärning från fel)

Den här processen gör att vi kan nivå upp våra driftsmetoder genom att kollektivt undersöka, granska och diskutera upplevelsen av varje betydande incident. Efter incidentgranskning kan vi lära oss av fel och är avgörande för tillförlitlighetsarbetet.

Testning/lansering (distribution)

Nästa nivå upp är fokus på våra test-, lanserings- och distributionsprocesser. Du kan se den här nivån som "hur bra är du på att skapa system och processer som kan fånga problem innan de orsakar incidenter?"

Kapacitetsplanering/skalning

Framgång och den tillväxt som följer med det kan vara lika mycket ett hot mot tillförlitligheten som alla problem med ett system. En kund kan inte se skillnaden mellan ett system som är nere eftersom det finns en bugg i koden och en som är nere eftersom den inte kan hantera belastningen på för många personer som försöker komma åt den samtidigt. Den här nivån i hierarkin instruerar oss att vara uppmärksamma på kapacitetsplanering och skalning som sätt att hantera det hotet.

Utvecklingsprocess och användarupplevelse

Det finns ytterligare två nivåer i hierarkin som inte tas upp i Förbättra din utbildningsväg för tillförlitlighet: utvecklingsprocessen och det arbete som går till att skapa en bra användarupplevelse (UX). De här två ämnena diskuteras inte i förbättra din tillförlitlighetsinlärningsväg, men andra bra Learn-moduler om dessa ämnen är tillgängliga.

Vi har skapat en separat Learn-modul för varje nivå i hierarkin för tillförlitlighet. Vi hoppas att du ansluter dig till oss för alla fem modulerna i den här utbildningsvägen.

Kontrollera dina kunskaper

1.

Vilken är den första, grundläggande nivån i Dickerson-hierarkin för tillförlitlighet?