Kontrolní seznam doporučení pro spolehlivost
Tento kontrolní seznam představuje sadu doporučení, která můžete použít k vyhodnocení spolehlivosti, odolnosti a strategií obnovy po selhání v návrhu architektury. K zajištění spolehlivosti identifikujte nejlepšího návrh infrastruktury a aplikací pro svou úlohu. Tato rozhodnutí provádějte na základě vašich obchodních požadavků, které jsou mapovány na cílové metriky dostupnosti a obnovitelnosti.
Chcete-li implementovat spolehlivý návrh, důkladně zvažte rozhodovací body ve svém návrhu a uvědomte si, jak tato rozhodnutí ovlivňují vaši úlohu. Tento kontrolní seznam a příručky, které jsou k němu přiloženy, nabízejí zdroje, které vám pomohou učinit tato rozhodnutí. Udělejte ze spolehlivosti úlohy ústřední hledisko v každé fázi návrhu, vývoje a životního cyklu provozu.
Kontrolní seznam
Přistupujte ke svému návrhu se zaměřením na spolehlivost, abyste zajistili, že navrhnete úlohu, která bude odolná, ovladatelná a opakovatelná. Pokud nezahrnete postupy spolehlivosti a nezvážíte kompromisy, váš návrh je potenciálně ohrožen. Pečlivě zvažte všechny body uvedené v kontrolním seznamu, abyste získali důvěru v úspěch vašeho systému.
Kód | Doporučení | |
---|---|---|
☐ | RE: 01 | Navrhněte svou pracovní zátěž tak, aby byla v souladu s obchodními cíli a vyhnula se zbytečné složitosti nebo režii. K rozhodování o návrhu zaujměte praktický a vyvážený přístup, který přináší požadované výsledky. Vytvořte návrh, jen jak je nezbytné, abyste minimalizovali neefektivitu a potenciální problémy. |
☐ | RE:02 | Identifikujte a ohodnoťte uživatelské a systémové toky. Použijte stupnici kritičnosti založenou na vašich obchodních požadavcích, abyste určili prioritu toků. |
☐ | RE: 03 | Použijte analýzu režimu selhání (FMA) k identifikaci a stanovení priority potenciálních selhání součástí vašeho řešení. Proveďte FMA, která vám pomůže posoudit riziko a účinek každého režimu selhání. Určete, jak bude úloha reagovat a jak se obnoví. |
☐ | RE: 04 | Definujte spolehlivost a cíle obnovy pro komponenty, toky a celkové řešení. Vizualizujte si cíle pro vyjednávání, dosažení konsenzu, stanovení očekávání a řízení akcí k dosažení ideálního stavu. Použijte definované cíle k vytvoření modelu stavu. Model správného stavu definuje, jak vypadá stav v pořádku, degradovaný a nesprávný. |
☐ | RE: 05 RE: 05 |
Posilte odolnost své pracovní zátěže implementací zpracování chyb a přechodných poruch. Zabudujte do řešení možnosti pro řešení selhání součástí a přechodných chyb. |
☐ | RE: 06 | Otestujte si scénáře odolnosti a dostupnosti použitím principů chaosového inženýrství ve vašem testovacím a produkčním prostředí. Použijte testování, abyste zajistili, že vaše strategie implementace elegantní degradace budou účinné, a to provedením aktivní poruchy a simulovaného zátěžového testování. |
☐ | RE: 07 | Implementujte strukturované, testované a zdokumentované plány kontinuity podnikání a obnovy po havárii (BCDR), které jsou v souladu s cíli obnovy. Plány musí zahrnovat všechny komponenty a systém jako celek. |
☐ | RE: 08 | Měřte a publikujte ukazatele stavu řešení. Průběžně zachycujte dobu provozuschopnosti a další údaje o spolehlivosti z celé úlohy a také z jednotlivých komponent a klíčových toků. |