Lista kontrolna zaleceń dotyczących niezawodności

Artykuł
10/16/2024

Ta lista kontrolna przedstawia zestaw zaleceń dotyczących oceny strategii niezawodności, odporności i odzyskiwania po awarii w architekturze projektu. Aby zapewnić niezawodność, zidentyfikuj najlepszy projekt infrastruktury i aplikacji do obciążenia. Podejmuj te decyzje w zależności od wymagań biznesowych mapowanych na metryki docelowe dostępności i odzyskiwania danych.

Aby wdrożyć wiarygodne projektowanie, należy dokładnie rozważyć punkty podjęcia decyzji w projekcie i mieć świadomość, w jaki sposób te decyzje mają wpływ na obciążenie. Ta lista kontrolna i przewodniki, które są z nią dostępne, oferują zasoby pomocne w podejmowaniu tych decyzji. Niezawodność obciążenia należy uwzględniać na każdym etapie projektowania, projektowania i cyklu życia operacji.

Lista kontrolna

W tym celu należy skupić się na niezawodności, aby zapewnić, że projektowane obciążenie będzie odporne, z możliwością zarządzania i powtarzalne. Jeśli nie uwzględniasz rozwiązań niezawodności i nie uwzględniasz transakcji, projekt jest potencjalnie narażony na ryzyko. Rozważ wszystkie punkty, które zostały uwzględnione na liście kontrolnej, aby zbudować pewność w sukces systemu.

	Kod	Rekomendacja
☐	RE:01	Zaprojektuj obciążenie tak, aby było zgodne z celami biznesowymi i unikaj niepotrzebnej złożoności lub narzutu. Aby podejmować decyzje dotyczące projektu, które zapewniają żądane rezultaty, należy stosować praktyczny i zrównoważony sposób. Należy także ograniczyć projekt i potencjalne problemy, aby zmniejszyć brak wydajności i potencjalne problemy.
☐	RE:02	Identyfikowanie i ocenianie przepływów użytkowników i systemów. Aby określić priorytety przepływów, należy użyć skali krytycznej opartej na wymaganiach biznesowych.
☐	RE:03	Analiza trybu awarii (FMA) umożliwia identyfikowanie i ustalanie priorytetów potencjalnych awarii w składnikach rozwiązania. Wykonaj FMA w celu dokonania oceny ryzyka i efektu poszczególnych trybów niepowodzenia. Określ sposób odpowiedzi i odzyskiwania obciążenia.
☐	RE:04	Zdefiniuj cele niezawodności i odzyskiwania dla składników, przepływów i całego rozwiązania. Zwizualizuj cele do negocjacji, uzyskaj i ustaw oczekiwania oraz ustaw działania mające na celu osiągnięcie idealnego stanu. Do tworzenia modelu kondycji można użyć zdefiniowanych wartości docelowych. Model kondycji definiuje stany, które są w dobrej kondycji, pogarszającej się kondycji i w złej kondycji.
☐	RE:05 RE:05	Zwiększ odporność obciążenia, implementując obsługę błędów i obsługę błędów przejściowych. Funkcje należy tworzyć w rozwiązaniu w celu obsługi awarii składników i błędów przejściowych.
☐	RE:06	Testuj scenariusze odporności i dostępności, stosując zasady inżynierii chaosu w środowiskach testowych i produkcyjnych. Zastosowanie testowania gwarantuje, że strategie implementacji tego programu są skuteczne przez przeprowadzenie aktywnego testowania i symulowanego testowania obciążenia.
☐	RE:07	Wdrażaj ustrukturyzowane, przetestowane i udokumentowane plany ciągłości działania i odzyskiwania po awarii (BCDR), które są zgodne z celami odzyskiwania. W planach muszą zostać także dodane wszystkie składniki i system jako całość.
☐	RE:08	Mierz i publikuj wskaźniki kondycji rozwiązania. W sposób ciągły przechwytuj dane dotyczące czasu pracy i innych danych niezawodności, które są wykorzystywane w całym obciążeniu, a także z poszczególnych składników i przepływów kluczowych.

Następne kroki

Kompromisy w zakresie niezawodności

Udostępnij za pośrednictwem

Lista kontrolna zaleceń dotyczących niezawodności

Lista kontrolna

Następne kroki

Opinia

Dodatkowe zasoby