Ciągłość działania i odzyskiwanie po awarii na potrzeby analizy w skali chmury
Podczas projektowania architektury usługi w chmurze należy wziąć pod uwagę wymagania dotyczące dostępności i sposób reagowania na potencjalne przerwy w działaniu usługi. Problem może zostać zlokalizowany dla określonego wystąpienia lub całego regionu. Posiadanie planów dla obu jest ważne. W zależności od docelowego czasu odzyskiwania i docelowego punktu odzyskiwania można wybrać agresywną strategię zapewnienia wysokiej dostępności i odzyskiwania po awarii.
Czasami można łączyć wysoką dostępność i odzyskiwanie po awarii. Te dwa obszary mają nieco różne strategie, zwłaszcza jeśli chodzi o dane. Aby dowiedzieć się więcej, zobacz Microsoft Azure Well-Architected Framework oraz jej zasady niezawodności .
Zamiast próbować zapobiegać awariom, zaakceptuj z góry, że błędy mogą się zdarzyć. Zminimalizuj skutki dowolnego pojedynczego uszkodzonego komponentu w cyklu życia. Tolerancja kosztów, punkt odzyskiwania oraz cel czasu odzyskiwania określa typ rozwiązania do wdrożenia.
Strategie tworzenia kopii zapasowych
Dostępnych jest wiele alternatywnych strategii implementowania rozproszonych zasobów obliczeniowych w różnych regionach. Strategie muszą być dostosowane do wymagań biznesowych i okoliczności aplikacji. Na wysokim poziomie podejścia należą do następujących kategorii:
Tworzenie kopii zapasowej i przywracanie: Przywróć aplikację bazy danych z ostatniej kopii zapasowej przed awarią. Takie podejście jest często stosowane po uszkodziniu lub przypadkowym usunięciu danych.
ponowne wdrożenie w przypadku awarii: ponownie wdrożyć aplikację od podstaw w momencie awarii. Takie podejście jest odpowiednie w przypadku aplikacji niekrytycznych, które nie wymagają gwarantowanego czasu odzyskiwania.
Gorący zapas (aktywny/pasywny): Utwórz zapasową usługę hostowaną w alternatywnym regionie. Rozmieść role, aby zagwarantować minimalną zdolność. Role nie odbierają ruchu produkcyjnego. Takie podejście jest przydatne w przypadku aplikacji, które nie są przeznaczone do dystrybucji ruchu między regionami.
Hot spare (aktywne/aktywne): Zaprojektuj aplikację do odbierania obciążenia produkcyjnego w wielu regionach. Usługi w chmurze można skonfigurować w każdym regionie pod kątem większej pojemności niż jest to wymagane w celach odzyskiwania po awarii. Zamiast tego, w przypadku awarii można skalować poziomo usługi w chmurze oraz przejść w tryb awaryjny.
Takie podejście wymaga inwestycji w projektowanie aplikacji, ale ma korzyści. Oferuje niski i gwarantowany czas odzyskiwania. Trwa ciągłe testowanie wszystkich lokalizacji odzyskiwania i efektywne wykorzystanie przepustowości. W przypadku aplikacji baz danych takie podejście obejmuje moduł równoważenia obciążenia dla dwóch baz danych, które są synchronizowane z jednym punktem połączenia.
Odzyskiwanie po awarii i wysoka dostępność usług platformy Azure
Analiza skali w chmurze składa się z kilku usług platformy Azure, które są pogrupowane w platformę, rdzeń i dane. Aby uzyskać więcej informacji na temat przewodników dotyczących niezawodności usługi i odzyskiwania po awarii, zobacz dokumentację niezawodności platformy Azure