Dela via


Checklista för designgranskning för tillförlitlighet

Den här checklistan innehåller en uppsättning rekommendationer som du kan använda för att utvärdera strategierna för tillförlitlighet, återhämtning och haveriberedskap i arkitekturdesignen. Identifiera den bästa infrastrukturen och programdesignen för din arbetsbelastning för att säkerställa tillförlitlighet. Fatta dessa beslut baserat på dina affärskrav som är mappade till målmått för tillgänglighet och återställning.

För att implementera en tillförlitlig design bör du noggrant överväga beslutspunkter i din design och vara medveten om hur dessa beslut påverkar din arbetsbelastning. Den här checklistan och tillhörande guider innehåller resurser som hjälper dig att fatta dessa beslut. Gör arbetsbelastningens tillförlitlighet till en central faktor under hela livscykeln för arbetsbelastningsdesign, utveckling och drift.

Checklista

Närma dig din design med fokus på tillförlitlighet för att säkerställa att du utformar en arbetsbelastning som är elastisk, hanterbar och repeterbar. Om du inte inkluderar tillförlitlighetsmetoder och överväger kompromisserna är din design potentiellt i fara. Överväg noggrant alla punkter som beskrivs i checklistan för att ingjuta förtroende för systemets framgång.

  Kod Rekommendation
RE:01 Fokusera din arbetsbelastningsdesign på enkelhet och effektivitet. Använd en praktisk metod för att undvika onödig komplexitet samtidigt som du uppfyller dina affärsmål och krav.
RE:02 Identifiera och betygsätta användar- och systemflöden. Använd en allvarlighetsskala baserat på dina affärskrav för att prioritera flödena.
RE:03 Använd analys av felläge (FMA) för att identifiera potentiella fel i din arbetsbelastning. Identifiera beroenden och felpunkter och utveckla riskreduceringsstrategier för dessa fel.
RE:04 Definiera tillförlitlighets- och återställningsmål för din arbetsbelastning. Använd målen för att informera din design och som grund för din hälsomodell.
RE:05
RE:05
RE:05
Lägg till redundans på olika nivåer, särskilt för kritiska flöden, för att uppfylla dina tillförlitlighetsmål. Överväg redundanta infrastrukturkomponenter som beräkning och nätverk och flera instanser av din lösning.
RE:06
RE:06
Implementera en strategi för tidsbaserad och tillförlitlig skalning på program-, data- och infrastrukturnivå. Basera skalningsstrategin på faktiska eller förutsagda användningsmönster och minimera manuella åtgärder.
RE:07 Stärka återhämtningsförmågan för din arbetsbelastning genom att implementera självbevarande och självåterställningsåtgärder. Använd inbyggda funktioner och väletablerade molnmönster för att hjälpa din arbetsbelastning att fungera under och återställa från incidenter.
RE:08 Testa robusthets- och tillgänglighetsscenarier genom att tillämpa principerna för kaosingenjörskonst. Se till att dina implementerings- och skalningsstrategier för graciös nedbrytning är effektiva genom att utföra aktiva fel och simulerad belastningstestning.
RE:09 Implementera strukturerade, testade och dokumenterade planer för affärskontinuitet och haveriberedskap (BCDR) som överensstämmer med återställningsmålen. Planerna måste omfatta alla komponenter och systemet som helhet.
RE:10 Mäta och modellera lösningens hälsosignaler. Samla kontinuerligt in drifttid och andra tillförlitlighetsdata från hela arbetsbelastningen och även från enskilda komponenter och nyckelflöden.

Nästa steg

Vi rekommenderar att du granskar tillförlitlighetsavvägningarna för att utforska andra begrepp.