Zalecenia dotyczące projektowania w wielu regionach o wysokiej dostępności
Dotyczy tego zalecenia listy kontrolnej dotyczącej niezawodności platformy Azure Well-Architected Framework:
RE:05 | Dodaj nadmiarowość na różnych poziomach, szczególnie w przypadku przepływów krytycznych. Zastosuj nadmiarowość do warstw obliczeniowych, danych, sieci i innych warstw infrastruktury zgodnie ze zidentyfikowanymi celami niezawodności. |
---|
Powiązane przewodniki: Nadmiarowość | przy użyciu stref dostępności i regionów
W tym przewodniku opisano zalecenia dotyczące projektowania środowiska chmury o wysokiej dostępności w wielu regionach. Wysoka dostępność to podstawowy zestaw projektowania pod kątem niezawodności. Architektura o wysokiej dostępności może pomóc uniknąć jak największego przestoju i wydajnego odzyskiwania, jeśli wystąpi przestój.
Aktywne-aktywne i aktywne-pasywne są ogólnymi typami architektury, które można stosować na różne sposoby, w zależności od platformy wdrażanej w środowisku. Ten przewodnik koncentruje się na projekcie środowiska chmury w wielu regionach. Na platformie Azure można również zaprojektować architekturę active-active-active-passive w jednym regionie przy użyciu stref dostępności. Aby uzyskać szczegółowe wskazówki dotyczące projektowania architektury o wysokiej dostępności przy użyciu stref dostępności, zobacz Przewodnik po platformie Azure Well-Architected Framework.
Kluczowe strategie projektowania
Aktywne i aktywne-pasywne to dwa podstawowe podejścia do projektowania środowiska chmury o wysokiej dostępności. Środowiska aktywne-aktywne są przeznaczone do obsługi obciążeń produkcyjnych w każdym regionie, w którym wdrażasz obciążenie. Środowiska aktywne-pasywne są przeznaczone do obsługi obciążeń produkcyjnych tylko w regionie podstawowym, ale w razie potrzeby przełączenia w tryb failover do regionu pomocniczego (pasywnego). Wybór najlepszych regionów świadczenia usługi Azure dla obciążenia jest kluczowym elementem projektowania środowiska z wieloma regionami o wysokiej dostępności. Aby uzyskać wskazówki dotyczące wybierania regionów platformy Azure, zobacz przewodnik Select Azure Regions (Wybieranie regionów świadczenia usługi Azure).
W tej sekcji opisano opcje projektowania, które należy wziąć pod uwagę podczas oceny każdego wzorca i uściślić architekturę w celu spełnienia wymagań biznesowych.
Zobacz Wzorzec sygnatur wdrażania, aby uzyskać wskazówki dotyczące tworzenia architektury obciążenia w powtarzalny, skalowalny sposób. Ten wzorzec projektu może pomóc w optymalizacji projektu wysokiej dostępności pod kątem wydajnego zarządzania.
W poniższych sekcjach opisano opcje projektowania tych dwóch wzorców.
Wdrażanie w aktywnych-aktywnych w przypadku bez przestoju
Aktywny-aktywny w pojemności: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest skonfigurowana do obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują i skalowalne do obsługi obciążeń z innych regionów w przypadku awarii regionalnej.
Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.
Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby funkcji odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych użyj replik do odczytu z parametry połączenia tylko do odczytu.
Zaleta tego projektu: niższe koszty operacyjne niż nadmierna aprowizowana konstrukcja.
Wadą tego projektu: Możliwe obniżenie środowiska użytkownika podczas skalowania w górę w celu spełnienia wymagań pełnego obciążenia, jeśli inny region doświadcza awarii.
Aktywna aprowizowana nadmierna aprowizowana: dublowane sygnatury wdrożenia w co najmniej dwóch regionach świadczenia usługi Azure, z których każda jest nadmiernie aprowizowana w celu obsługi obciążeń produkcyjnych dla regionu lub regionów, które obsługują, oraz obsługi obciążeń z innych regionów w przypadku awarii regionalnej.
Sieć: użyj opóźnienia lub routingu globalnego ważonego , aby rozłożyć ruch między regionami.
Replikacja i spójność danych: używaj globalnie rozproszonego magazynu danych, takiego jak usługa Azure Cosmos DB , na potrzeby funkcji odczytu i zapisu w wielu regionach. W przypadku relacyjnych baz danych użyj replik do odczytu z parametry połączenia tylko do odczytu.
Zaleta tego projektu: najbardziej odporny projekt jest możliwy.
Wadą tego projektu: Wyższe koszty operacyjne niż skalowalny projekt.
Typowe zalety obu projektów: wysoka odporność i niskie ryzyko awarii pełnego obciążenia.
Typowe wady obu projektów: wyższe koszty operacyjne i obciążenie związane z zarządzaniem ze względu na różne czynniki, w tym konieczność zarządzania synchronizacją stanu aplikacji i danych.
Wdrażanie w trybie aktywny-pasywny na potrzeby odzyskiwania po awarii
Ciepły zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest wdrażany z minimalnym możliwym rozmiarem i rozmiarem danych oraz jest uruchamiany bez ładowania. Ten region jest znany jako ciepły region zapasowy . Po przejściu w tryb failover zasoby obliczeniowe i zasoby danych są skalowane w celu obsługi obciążenia z regionu podstawowego.
Sieć: Użyj priorytetowego routingu globalnego.
Replikacja danych i spójność: Replikuj bazę danych do pasywnego regionu i korzystaj z automatycznych możliwości trybu failover rozwiązań typu platforma jako usługa (PaaS), takich jak Azure Cosmos DB i Azure SQL Database.
Zaletą tego projektu: najkrótszy czas odzyskiwania wśród projektów aktywny-pasywny.
Wadą tego projektu: Najwyższy koszt operacyjny wśród projektów aktywny-pasywny.
Zimny zapasowy: jeden region podstawowy i co najmniej jeden region pomocniczy. Region pomocniczy jest skalowany w celu obsługi pełnego obciążenia, ale wszystkie zasoby obliczeniowe są zatrzymywane. Ten region jest znany jako zimny region zapasowy . Przed przejściem w tryb failover należy uruchomić zasoby.
Sieć: Użyj priorytetowego routingu globalnego.
Replikacja i spójność danych: Replikuj bazę danych do pasywnego regionu i korzystaj z automatycznych możliwości trybu failover rozwiązań PaaS, takich jak Azure Cosmos DB i Azure SQL Database.
Zaletą tego projektu: niższe koszty operacyjne niż ciepły zapasowy projekt.
Wadą tego projektu: Dłuższy czas odzyskiwania niż ciepły zapasowy projekt.
Ponowne wdrażanie w przypadku awarii: jeden region podstawowy i co najmniej jeden region pomocniczy. Tylko niezbędna sieć jest wdrażana w regionie pomocniczym. Operatorzy muszą uruchamiać skrypty aprowizacji w regionie pomocniczym, aby przejąć obciążenia w tryb failover. Ten projekt jest znany jako ponowne wdrażanie w przypadku awarii.
Sieć: Użyj priorytetowego routingu globalnego.
Replikacja i spójność danych: wdróż nowe wystąpienia bazy danych i ponownie wypełnianie danych z kopii zapasowych.
Zaletą tego projektu: najniższe koszty operacyjne.
Wadą tego projektu: najdłuższy czas odzyskiwania.
Typowe zalety projektów aktywnych-pasywnych: niższe koszty operacyjne i mniejsze obciążenie związane z zarządzaniem codziennym niż projekty aktywne-aktywne. Nie trzeba synchronizować stanu aplikacji.
Typowe wady projektów aktywnych-pasywnych: Dłuższy, bardziej złożony proces odzyskiwania. Większe prawdopodobieństwo konieczności ręcznej interwencji w celu pomyślnego przejścia w tryb failover.
Uwaga
Niezależnie od projektu wysokiej dostępności należy pamiętać o skonfigurowaniu nadmiarowości dla usług pomocniczych, takich jak infrastruktura usługi Azure DevOps, pola przesiadkowe, monitorowanie i wszelkie inne krytyczne usługi niezbędne do administrowania obciążeniem.
Ułatwienia platformy Azure
Usługa Azure Front Door łączy globalne funkcje routingu usługi Azure Traffic Manager z systemem dostarczania zawartości i zaporą aplikacji internetowej, aby ułatwić zarządzanie obciążeniem o wysokiej dostępności.
Azure Cosmos DB to globalnie rozproszona platforma bazy danych NoSQL, która może pomóc w uruchomieniu aktywnego środowiska aktywnego i zminimalizować ryzyko przestoju w przypadku wystąpienia regionalnej awarii.
Pokrewne łącza
Lista kontrolna dotycząca niezawodności
Zapoznaj się z pełnym zestawem zaleceń.