Del via


Tjekliste for anbefaling af pålidelighed

Denne kontrolliste indeholder et sæt anbefalinger, du kan bruge til at evaluere pålideligheden, robustheden og strategier for gendannelse efter fejl i dit arkitekturdesign. For at sikre pålidelighed skal du identificere den bedste infrastruktur og det bedste programdesign til din arbejdsbelastning. Disse beslutninger træffes ud fra de forretningskrav, der er knyttet til målmetrikværdierne for tilgængelighed og gendannelsesmuligheder.

Hvis du vil implementere et pålideligt design, skal du nøje overveje beslutningspunkterne i dit design og være opmærksom på, hvordan disse beslutninger påvirker din arbejdsbelastning. Denne kontrolliste og de vejledninger, der følger med, tilbyder ressourcer, der kan hjælpe dig med at træffe disse beslutninger. Gør pålidelighed af arbejdsbelastning til en central overvejelse i alle faser af design, udvikling og drift i hele livscyklussen.

Kontrolliste

Du kan bruge dit design med fokus på pålidelighed til at sikre, at du designer en arbejdsbelastning, der er robust, håndterbar og kan gentages. Hvis du ikke inkluderer praksis for pålidelighed, og du overvejer afvejning, er der risiko for, at dit design udsættes for fare. Overvej nøje alle de punkter, der er omfattet af kontrollisten, for at skabe tillid til systemets succes.

  Kode Anbefaling
RE:01 Design din arbejdsbyrde, så den stemmer overens med forretningsmål og undgår unødvendig kompleksitet eller overhead. Brug en praktisk og balanceret tilgang til at træffe designbeslutninger, der giver de ønskede resultater. Inddæm dit design til de forskellige muligheder for at reducere ineffektivitet og potentielle problemer.
RE:02 Identificer og vurder bruger- og systemflows. Brug en kritisk skala, der er baseret på dine forretningskrav, til at prioritere flowet.
RE:03 Brug FMA (Failure Mode Analysis - fejltilstandsanalyse) til at identificere og prioritere potentielle fejl i løsningskomponenterne. Udfør FMA for at få hjælp til at vurdere risikoen og effekten af de enkelte fejltilstande. Fastlæg, hvordan arbejdsbelastningen reagerer og gendannes.
RE:04 Definer pålideligheds- og gendannelsesmål for komponenterne, flowene og den overordnede løsning. Visualiser målene for at afstemme, opnå konsensus, angive forventninger og drive handlinger for at opnå den ideelle tilstand. Brug de definerede mål til at oprette en tilstandsmodel. I tilstandsmodellen defineres, hvordan sunde, forringede og usunde tilstande ser ud.
RE:05
RE:05
Styrk robustheden af din arbejdsbyrde ved at implementere fejlhåndtering og forbigående fejlhåndtering. Opbyg funktionerne i løsningen til at håndtere komponentfejl og midlertidige fejl.
RE:06 Test for robustheds- og tilgængelighedsscenarier ved at anvende principperne for kaosteknik i dine test- og produktionsmiljøer. Test for at sikre, at dine implementeringsstrategier for problemfri forringelse er effektive ved at udføre aktiv test af fejlfunktion og simuleret belastning.
RE:07 Implementer strukturerede, testede og dokumenterede planer for forretningskontinuitet og it-katastrofeberedskab (BCDR), der stemmer overens med genoprettelsesmålene. Planer skal dække alle komponenter og systemet som en helhed.
RE:08 Mål og publicer løsningens sundhedsindikatorer. Du kan kontinuerligt registrere oppetid og andre pålidelighedsdata fra hele arbejdsbelastningen og fra individuelle komponenter og nøgleforløb.

Næste trin