Niezawodność w elastycznej sieci SAN
W tym artykule opisano obsługę niezawodności w usłudze Azure Elastic SAN i opisano zarówno odporność regionalną ze strefami dostępności, jak i odzyskiwaniem po awarii oraz ciągłością działania.
Obsługa strefy dostępności
Strefy dostępności są fizycznie oddzielnymi grupami centrów danych w każdym regionie świadczenia usługi Azure. Gdy jedna strefa ulegnie awarii, usługi mogą przejść w tryb failover do jednej z pozostałych stref.
Aby uzyskać więcej informacji na temat stref dostępności na platformie Azure, zobacz Co to są strefy dostępności?
Usługa Azure Elastic SAN obsługuje wdrażanie strefy dostępności z magazynem lokalnie nadmiarowym (LRS) i wdrożeniem regionalnym z magazynem strefowo nadmiarowym (ZRS).
Wymagania wstępne
Magazyn LRS i elastyczna sieć SAN ZRS są obecnie dostępne tylko w podzestawie regionów. Aby uzyskać listę regionów, zobacz Cele skalowania dla elastycznej sieci SAN.
Tworzenie zasobu przy użyciu stref dostępności
Aby utworzyć elastyczną sieć SAN z włączoną strefą dostępności, zobacz Wdrażanie elastycznej sieci SAN.
Środowisko strefowe w dół
W przypadku wdrażania elastycznej sieci SAN w przypadku wybrania warstwy ZRS dla opcji nadmiarowości sieci SAN tryb failover strefowy jest obsługiwany przez platformę. Jeśli używasz prywatnego punktu końcowego do nawiązywania połączenia z elastyczną siecią SAN, przejście w tryb failover odbywa się bez ręcznej interwencji. Elastyczna sieć SAN ZRS korzystająca z prywatnych punktów końcowych i jest przeznaczona do samoleczenia i ponownego równoważenia w celu automatycznego korzystania ze stref w dobrej kondycji. Dostępność i obniżenie wydajności mogą potrwać kilka minut po przejściu w tryb failover do momentu ponownego równoważenia sieci SAN.
Jeśli łączysz się przy użyciu punktów końcowych usługi magazynu, tryb failover strefowy jest obsługiwany, ale może wymagać interwencji ręcznej. Elastyczna sieć SAN ZRS korzystająca z punktów końcowych usługi magazynu nie będzie automatycznie przełączać się do strefy w dobrej kondycji. Może być konieczne ponowne uruchomienie inicjatora iSCSI, aby zainicjować przejście w tryb failover do innej strefy w dobrej kondycji.
W przypadku wdrożenia elastycznej sieci SAN LRS może być konieczne wdrożenie nowej sieci SAN przy użyciu migawek wyeksportowanych na dyski zarządzane.
Projekt o małych opóźnieniach
Wdrażanie elastycznej sieci SAN magazynu ZRS zapewnia większą niezawodność niż elastyczna sieć SAN LRS, ale zwiększa opóźnienie zapisu. Przeprowadź test porównawczy elastycznej sieci SAN i symuluj obciążenie aplikacji, aby porównać opóźnienie między magazynem LRS i magazynem ZRS, aby sprawdzić, czy ma to wpływ na obciążenie.
Migracja strefy dostępności
Aby przeprowadzić migrację elastycznej sieci SAN w warstwie LRS do magazynu ZRS, utwórz migawki elastycznych woluminów SIECI SAN, wyeksportuj je do migawek dysków zarządzanych, wdróż elastyczną sieć SAN w magazynach ZRS, a następnie utwórz woluminy w sieci SAN w usłudze ZRS przy użyciu tych migawek dysków. Aby dowiedzieć się, jak używać migawek (wersja zapoznawcza), zobacz Snapshot Azure Elastic SAN volumes (wersja zapoznawcza).
Ciągłość biznesowa i odzyskiwanie po awarii
Odzyskiwanie po awarii dotyczy odzyskiwania po wystąpieniu zdarzeń o dużym wpływie, takich jak klęski żywiołowe lub nieudane wdrożenia, które powodują przestoje i utratę danych. Niezależnie od przyczyny najlepszym rozwiązaniem dla awarii jest dobrze zdefiniowany i przetestowany plan odzyskiwania po awarii oraz projekt aplikacji, który aktywnie obsługuje odzyskiwanie po awarii. Zanim zaczniesz myśleć o tworzeniu planu odzyskiwania po awarii, zobacz Zalecenia dotyczące projektowania strategii odzyskiwania po awarii.
Jeśli chodzi o odzyskiwanie po awarii, firma Microsoft korzysta z modelu wspólnej odpowiedzialności. W modelu wspólnej odpowiedzialności firma Microsoft zapewnia dostępność infrastruktury bazowej i usług platformy. Jednocześnie wiele usług platformy Azure nie replikuje automatycznie danych ani nie wraca z regionu, w którym wystąpił błąd, aby przeprowadzić replikację krzyżową do innego regionu z włączoną obsługą. W przypadku tych usług odpowiadasz za skonfigurowanie planu odzyskiwania po awarii, który działa dla obciążenia. Większość usług uruchamianych na platformie Azure jako usługa (PaaS) oferuje funkcje i wskazówki dotyczące obsługi odzyskiwania po awarii. Funkcje specyficzne dla usługi umożliwiają szybkie odzyskiwanie w celu ułatwienia opracowania planu odzyskiwania po awarii.
Odzyskiwanie po awarii w jednym i wielu regionach
W przypadku elastycznej sieci SAN odpowiadasz za środowisko odzyskiwania po awarii (DR). Możesz wykonywać migawki woluminów i eksportować je do migawek dysków zarządzanych. Następnie możesz skopiować migawkę przyrostową do nowego regionu w celu przechowywania danych w regionie innym niż region, w którym znajduje się elastyczna sieć SAN. Należy wyeksportować do regionów, które są geograficznie odległe od regionu podstawowego, aby zmniejszyć prawdopodobieństwo wystąpienia awarii wielu regionów.
Wykrywanie, powiadamianie i zarządzanie awariami
Deklaracje awarii można znaleźć w usłudze Service Health — Microsoft Azure.
Wydajność i proaktywna odporność odzyskiwania po awarii
Firma Microsoft i jej klienci działają w ramach modelu wspólnej odpowiedzialności. Wspólna odpowiedzialność oznacza, że w przypadku odzyskiwania po awarii z obsługą klienta (usług odpowiedzialnych za klienta) należy rozwiązać problem z odzyskiwaniem po awarii dla każdej wdrożonej usługi i kontroli. Wstępnie zweryfikuj wszystkie wdrożone usługi współdziałają z elastyczną siecią SAN. Aby upewnić się, że odzyskiwanie jest proaktywne, wstępnie wdróż pomocnicze, aby upewnić się, że nie ma problemów z pojemnością w przypadku wystąpienia wpływu na środowiska.