Aanbevelingschecklist voor betrouwbaarheid

Artikel
10/16/2024

Deze checklist bevat een reeks aanbevelingen die u kunt gebruiken om de betrouwbaarheid, tolerantie en strategieën voor foutherstel in uw architectuurontwerp te evalueren. Om betrouwbaarheid te garanderen bepaalt u het beste infrastructuur- en toepassingsontwerp voor uw workload. Neem deze beslissingen op basis van uw bedrijfsvereisten, die zijn gekoppeld aan de doelstatistieken voor beschikbaarheid en herstelbaarheid.

Om een betrouwbaar ontwerp te implementeren, moet u de beslissingspunten in uw ontwerp grondig overwegen en u ervan bewust zijn hoe deze beslissingen uw workload beïnvloeden. Deze checklist en de bijbehorende guides bieden hulpmiddelen die u kunnen helpen bij het nemen van die beslissingen. Zorg ervoor dat de betrouwbaarheid van de workload een centrale overweging is in elke fase van het ontwerp, de ontwikkeling en de operationele levenscyclus van de workload.

Controlelijst

Benader uw ontwerp met de nadruk op betrouwbaarheid om ervoor te zorgen dat u een workload ontwerpt die tolerant, beheersbaar en herhaalbaar is. Als u geen betrouwbaarheidsprocedures opneemt en de afwegingen overweegt, loopt uw ontwerp mogelijk gevaar. Denk zorgvuldig na over alle punten die in de checklist worden behandeld, zodat vertrouwen kunt hebben in het succes van uw systeem.

	Code	Aanbeveling
☐	RE:01	Ontwerp uw werklast zo dat uitlijnen aansluit bij uw bedrijfsdoelstellingen en vermijd onnodige complexiteit of overhead. Gebruik een praktische en evenwichtige aanpak om ontwerpbeslissingen te nemen die de gewenste resultaten opleveren. Zorg ervoor dat uw ontwerp voldoet aan de vereisten om inefficiënties en potentiële problemen te beperken.
☐	RE:02	Identificeren en beoordelen van gebruikers- en systeemstromen. Gebruik een kriticiteitsschaal op basis van uw bedrijfsvereisten om prioriteit te geven aan de stromen.
☐	RE:03	Gebruik Failure Mode Analysis (FMA) om potentiële fouten in de onderdelen van uw oplossing te identificeren en te prioriteren. Voer FMA uit om u te helpen het risico en de gevolgen van elke storingsmodus te beoordelen. Bepaal hoe de workload reageert en herstelt.
☐	RE:04	Definieer betrouwbaarheids- en hersteldoelen voor de componenten, de stromen en de algehele oplossing. Visualiseer de doelen om te onderhandelen, consensus te bereiken, verwachtingen te scheppen en acties te ondernemen om de ideale situatie te bereiken. Gebruik de gedefinieerde doelen om het gezondheidsmodel te bouwen. Het gezondheidsmodel definieert hoe gezonde, gedegradeerde en ongezonde toestanden eruit zien.
☐	RE:05 RE:05	Versterk de veerkracht van uw werklast door foutverwerking en tijdelijke foutverwerking te implementeren. Bouw mogelijkheden in de oplossing om onderdeelstoringen en kortstondige fouten op te lossen.
☐	RE:06	Test veerkracht- en beschikbaarheidsscenario's door de principes van chaos engineering toe te passen in uw test- en productieomgevingen. Gebruik tests om ervoor te zorgen dat uw implementatiestrategieën voor correcte degradatie effectief zijn door actieve storings- en gesimuleerde belastingtests uit te voeren.
☐	RE:07	Implementeer gestructureerde, geteste en gedocumenteerde plannen voor bedrijfscontinuïteit en noodherstel (BCDR) die uitlijnen zijn met de hersteldoelen. Plannen moeten alle onderdelen en het systeem als geheel omvatten.
☐	RE:08	Meet en publiceer de gezondheidsindicatoren van de oplossing. Leg continu uptime- en andere betrouwbaarheidsgegevens vast van de hele workload, maar ook van individuele onderdelen en belangrijke stromen.

Volgende stappen

Afwegingen op het gebied van betrouwbaarheid

Delen via

Aanbevelingschecklist voor betrouwbaarheid

Controlelijst

Volgende stappen

Feedback

Aanvullende resources