Skuldlösa postmortems

Slutförd

Organisationer som tränar DevOps vill visa misstag och fel med målet att lära sig. Att ha skuldlösa postmortems på avbrott och olyckor är en del av det målet.

Att ha en rättvis kultur innebär att du anstränger dig för att balansera säkerhet och ansvarsskyldighet. Det innebär att genom att undersöka misstag på ett sätt som fokuserar på situationella aspekter av ett misslyckande och på individers beslutsprocess nära misslyckandet, kan en organisation komma ut säkrare än den skulle göra om den hade straffat de inblandade personerna.

En oskyldig obduktion innebär att ingenjörer vars handlingar har bidragit till en olycka kan ge en detaljerad redogörelse för:

  • Vilka åtgärder de vidtog vid vilken tidpunkt.
  • Vilka effekter de observerade.
  • Vilka förväntningar de hade.
  • Vilka antaganden de gjorde.
  • Deras förståelse av tidslinjen för händelser när de inträffade.

Det är viktigt att de kan ge detta detaljerade konto utan rädsla för straff eller vedergällning.

En ingenjör som tror att de kommer att tillrättavisas har inget incitament att ge en realistisk och korrekt redogörelse för problemet. Att inte förstå hur en olycka inträffade garanterar att det kommer att hända igen; om inte med den ursprungliga ingenjören, så med någon annan.

" Vi måste sträva efter att förstå att olyckor inte inträffar eftersom människor spelar och förlorar. Olyckor inträffar eftersom personen anser att:

... vad som är på väg att hända är inte möjligt, ... vad är på väg att hända har ingen koppling till vad de gör, ... eller att möjligheten att få det avsedda resultatet är väl värd den risk som finns."

Erik Hollnagel

Tillåt ingenjörer att äga sina egna berättelser

En rolig sak händer när ingenjörer gör misstag och känner sig säkra när de ger detaljer om det. De är inte bara villiga att hållas ansvariga, de är också entusiastiska över att hjälpa resten av företaget att undvika samma fel i framtiden. De är trots allt de som har mest expertis när det gäller felet. De borde vara starkt involverade i att komma fram till reparationen.

Hur gör jag för att aktivera en "rättvis kultur"?

  • Uppmuntra inlärning genom att ha skuldlösa postmortems på avbrott och olyckor.
  • Påminn dig själv om att målet är att förstå hur en olycka kunde ha inträffat för att bättre utrusta oss från det som händer i framtiden.
  • Samla in information från flera perspektiv om misslyckanden och straffa inte människor för att göra misstag.
  • I stället för att straffa ingenjörer, ge dem den auktoritet som behövs för att förbättra säkerheten genom att låta dem ge detaljerade redogörelser för sina bidrag till misslyckanden.
  • Aktivera och uppmuntra människor som gör misstag att vara experter på att utbilda resten av organisationen om hur man inte gör dem i framtiden.
  • Acceptera att det alltid finns ett diskretionärt utrymme där människor kan besluta att agera eller inte agera, och att bedömningen av dessa beslut ligger i efterhand.
  • Acceptera att efterklokhetsfördomar kan göra vår utvärdering av tidigare händelser i molnet, så arbeta hårt för att eliminera den.
  • Acceptera att det grundläggande attributionsfelet också är svårt att undkomma, så fokusera på miljön och de omständigheter som människor arbetar i när de utreder olyckor.
  • Sträva efter att se till att organisationens trubbiga slut (till exempel styrelser eller ledande befattningshavare) förstår hur arbetet faktiskt utförs. Jämför detta med hur de föreställer sig att det görs, genom Gantt-diagram och procedurer i den skarpa änden (till exempel ingenjörer och teknik).
  • Den skarpa änden måste informera organisationen om var linjen ligger mellan lämpligt och olämpligt beteende. Det här är inget som den trubbiga änden kan komma på på egen hand.

Fel inträffar. För att förstå hur fel inträffar måste vi först förstå våra reaktioner på misslyckande.