Architektura odzyskiwania po awarii z programu VMware do platformy Azure — modernizacja
W tym artykule opisano architekturę i procesy używane podczas wdrażania replikacji odzyskiwania po awarii, trybu failover i odzyskiwania maszyn wirtualnych VMware między lokalną lokacją VMware i platformą Azure przy użyciu zmodernizowanego środowiska ochrony maszyn wirtualnych VMware/fizycznego.
Uwaga
Upewnij się, że utworzono nowy magazyn usługi Recovery Services na potrzeby konfigurowania urządzenia replikacji usługi ASR. Nie używaj istniejącego magazynu.
Aby uzyskać informacje o architekturze usługi Azure Site Recovery w architekturze klasycznej, zobacz ten artykuł.
Składniki architektury
Poniższa tabela i grafika przedstawiają ogólny widok składników używanych do odzyskiwania po awarii maszyn wirtualnych VMware/maszyn fizycznych na platformie Azure.
Składnik | Wymaganie | Szczegóły |
---|---|---|
Azure | Subskrypcja platformy Azure, konto usługi Azure Storage na potrzeby pamięci podręcznej, dysku zarządzanego i sieci platformy Azure. | Replikowane dane z lokalnych maszyn wirtualnych są przechowywane w usłudze Azure Storage. Maszyny wirtualne platformy Azure są tworzone przy użyciu replikowanych danych podczas uruchamiania trybu failover ze środowiska lokalnego na platformę Azure. Maszyny wirtualne platformy Azure nawiązują połączenie z siecią wirtualną platformy Azure, gdy są tworzone. |
Urządzenie replikacji usługi Azure Site Recovery | Jest to podstawowy blok konstrukcyjny całej infrastruktury lokalnej usługi Azure Site Recovery. Wszystkie składniki urządzenia koordynują się z urządzeniem replikacji. Ta usługa nadzoruje wszystkie kompleksowe działania usługi Site Recovery, w tym monitorowanie kondycji chronionych maszyn, replikacji danych, automatycznych aktualizacji itp. |
Urządzenie hostuje różne kluczowe składniki, takie jak: Serwer proxy: ten składnik działa jako kanał proxy między agentem mobilności a usługami Site Recovery w chmurze. Gwarantuje to, że w przypadku obciążeń produkcyjnych nie jest wymagana żadna inna łączność z Internetem w celu wygenerowania punktów odzyskiwania. Odnalezione elementy: ten składnik zbiera informacje o programie vCenter i koordynuje je z usługą zarządzania usługi Azure Site Recovery w chmurze. Serwer ponownej ochrony: ten składnik koordynuje się między platformą Azure i maszynami lokalnymi podczas operacji ponownego włączania ochrony i powrotu po awarii. Serwer przetwarzania: ten składnik jest używany do buforowania, kompresji danych przed wysłaniem na platformę Azure. Dowiedz się więcej o urządzeniu replikacji i sposobie używania wielu urządzeń replikacji. Agent usługi Recovery Service: ten składnik służy do konfigurowania/rejestrowania w usługach Site Recovery oraz monitorowania kondycji wszystkich składników. Dostawca usługi Site Recovery: ten składnik służy do ułatwiania ponownego włączania ochrony. Identyfikuje między alternatywną lokalizacją ponownej ochrony i oryginalną lokalizacją ponownego włączania ochrony maszyny źródłowej. Usługa replikacji: ten składnik służy do replikowania danych z lokalizacji źródłowej do platformy Azure. |
Serwery VMware | Maszyny wirtualne VMware są hostowane na lokalnych serwerach vSphere ESXi. Zalecamy serwer vCenter do zarządzania hostami. | Podczas wdrażania usługi Site Recovery serwery VMware są dodawane do magazynu usługi Recovery Services. |
Zreplikowane maszyny | Usługa mobilności jest instalowana na każdej replikowanej maszynie wirtualnej VMware. | Zalecamy zezwolenie na automatyczną instalację usługi mobilności. Alternatywnie możesz zainstalować usługę ręcznie. |
Konfigurowanie wychodzącej łączności sieciowej
Aby usługa Site Recovery działała zgodnie z oczekiwaniami, należy zmodyfikować wychodzącą łączność sieciową, aby umożliwić replikację środowiska.
Uwaga
Usługa Site Recovery nie obsługuje sterowania łącznością sieciową za pomocą uwierzytelniającego serwera proxy.
Połączenia ruchu wychodzącego dla adresów URL
Jeśli używasz serwera proxy zapory opartego na adresach URL do kontrolowania łączności wychodzącej, zezwól na dostęp do następujących adresów URL:
Adres URL | Szczegóły |
---|---|
portal.azure.com |
Przejdź do witryny Azure Portal. |
*.windows.net *.msftauth.net *.msauth.net *.microsoft.com *.live.com *.office.com |
Aby zalogować się do subskrypcji platformy Azure. |
*.microsoftonline.com |
Utwórz aplikacje firmy Microsoft Entra dla urządzenia w celu komunikowania się z usługą Azure Site Recovery. |
management.azure.com |
Utwórz aplikacje firmy Microsoft Entra dla urządzenia w celu komunikowania się z usługą Azure Site Recovery. |
*.services.visualstudio.com |
Przekaż dzienniki aplikacji używane do monitorowania wewnętrznego. |
*.vault.azure.net |
Zarządzanie wpisami tajnymi w usłudze Azure Key Vault. Uwaga: Upewnij się, że maszyny, które mają być replikowane, mają dostęp do tego. |
aka.ms |
Zezwalaj na dostęp do linków "znanych również jako". Służy do aktualizacji urządzenia usługi Azure Site Recovery. |
download.microsoft.com/download |
Zezwalaj na pobieranie ze strony pobierania przez firmę Microsoft. |
*.servicebus.windows.net |
Komunikacja między urządzeniem a usługą Azure Site Recovery. |
*.discoverysrv.windowsazure.com |
Połącz się z adresem URL usługi odnajdywania usługi Azure Site Recovery. |
*.hypervrecoverymanager.windowsazure.com |
Połącz się z adresami URL mikrousług usługi Azure Site Recovery. |
*.blob.core.windows.net |
Przekazywanie danych do usługi Azure Storage, która służy do tworzenia dysków docelowych. |
*.backup.windowsazure.com |
Adres URL usługi ochrony — mikrousługi używane przez usługę Azure Site Recovery do przetwarzania i tworzenia replikowanych dysków na platformie Azure. |
*.prod.migration.windowsazure.com |
Aby odnaleźć swój majątek lokalny. |
Proces replikacji
Po włączeniu replikacji maszyny wirtualnej rozpoczyna się replikacja początkowa do usługi Azure Storage przy użyciu określonych zasad replikacji. Należy zwrócić uwagę na następujące kwestie:
- W przypadku maszyn wirtualnych VMware replikacja jest na poziomie bloku, niemal ciągła przy użyciu agenta usługa mobilności uruchomionego na maszynie wirtualnej.
- Wszystkie ustawienia zasad replikacji są stosowane:
- Próg celu punktu odzyskiwania. To ustawienie nie ma wpływu na replikację. Pomaga to w monitorowaniu. Zostanie zgłoszone zdarzenie i opcjonalnie wysłana wiadomość e-mail, jeśli bieżący cel punktu odzyskiwania przekroczy określony limit progowy.
- Przechowywanie punktów odzyskiwania. To ustawienie określa, jak daleko w czasie chcesz przejść po wystąpieniu zakłóceń. Maksymalny okres przechowywania wynosi 15 dni.
- Migawki spójne na poziomie aplikacji. Migawka spójna na poziomie aplikacji może być wykonywana co 1 do 12 godzin, w zależności od potrzeb aplikacji. Migawki to standardowe migawki obiektów blob platformy Azure. Agent mobilności uruchomiony na maszynie wirtualnej żąda migawki usługi VSS zgodnie z tym ustawieniem i zakładki, które wskazują punkt w czasie jako punkt spójny aplikacji w strumieniu replikacji.
Uwaga
Wysoki okres przechowywania punktu odzyskiwania może mieć wpływ na koszt magazynu, ponieważ może być konieczne zapisanie większej liczby punktów odzyskiwania.
Ruch jest replikowany do publicznych punktów końcowych usługi Azure Storage za pośrednictwem Internetu. Alternatywnie możesz użyć usługi Azure ExpressRoute z komunikacją równorzędną firmy Microsoft. Replikowanie ruchu przez wirtualną sieć prywatną typu lokacja-lokacja (VPN) z lokacji lokalnej do platformy Azure jest obsługiwane tylko w przypadku korzystania z prywatnych punktów końcowych.
Początkowa operacja replikacji gwarantuje, że całe dane na maszynie w momencie włączenia replikacji są wysyłane na platformę Azure. Po zakończeniu replikacji początkowej rozpoczyna się replikacja zmian różnicowych na platformę Azure. Śledzone zmiany maszyny są wysyłane do serwera przetwarzania.
Komunikacja odbywa się w następujący sposób:
- Maszyny wirtualne komunikują się z urządzeniem lokalnym na porcie HTTPS 443 przychodzącym na potrzeby zarządzania replikacją.
- Maszyny wirtualne wysyłają dane replikacji do urządzenia na porcie HTTPS 9443 przychodzącym. Ten port można zmodyfikować.
- Urządzenie odbiera dane replikacji, optymalizuje je i szyfruje oraz wysyła je do usługi Azure Storage za pośrednictwem portu 443 wychodzącego.
Dzienniki danych replikacji najpierw trafiają na konto magazynu pamięci podręcznej na platformie Azure. Te dzienniki są przetwarzane, a dane są przechowywane na dysku zarządzanym platformy Azure (nazywanym asrseeddisk). Punkty odzyskiwania są tworzone na tym dysku.
Proces ponownej synchronizacji
- Czasami podczas replikacji początkowej lub podczas przesyłania zmian różnicowych mogą wystąpić problemy z łącznością sieciową między maszyną źródłową a serwerem przetwarzania lub między serwerem przetwarzania na platformie Azure. Jeden z tych elementów może prowadzić do niepowodzeń w transferze danych na platformę Azure.
- Aby uniknąć problemów z integralnością danych i zminimalizować koszty transferu danych, usługa Site Recovery oznacza maszynę do ponownej synchronizacji.
- Maszynę można również oznaczyć do ponownej synchronizacji w sytuacjach, takich jak w następujących sytuacjach, aby zachować spójność między maszyną źródłową a danymi przechowywanymi na platformie Azure
- Jeśli maszyna przejdzie wymuszone zamknięcie
- Jeśli maszyna przechodzi zmiany konfiguracyjne, takie jak zmiana rozmiaru dysku (modyfikowanie rozmiaru dysku z 2 TB do 4 TB)
- Ponowne synchronizowanie wysyła tylko dane różnicowe na platformę Azure. Transfer danych między środowiskiem lokalnym a platformą Azure przez zminimalizowanie przez obliczanie sum kontrolnych danych między maszyną źródłową a danymi przechowywanymi na platformie Azure.
- Domyślnie ponowna synchronizacja jest zaplanowana do automatycznego uruchamiania poza godzinami pracy. Jeśli nie chcesz czekać na domyślną ponowną synchronizację poza godzinami, możesz ponownie zsynchronizować maszynę wirtualną ręcznie. Aby to zrobić, przejdź do witryny Azure Portal, wybierz ponownie synchronizację maszyny wirtualnej.>
- Jeśli domyślna ponowna synchronizacja zakończy się niepowodzeniem poza godzinami pracy i wymagana jest ręczna interwencja, na określonym komputerze w witrynie Azure Portal zostanie wygenerowany błąd. Możesz usunąć błąd i ręcznie wyzwolić ponowną synchronizację.
- Po zakończeniu ponownej synchronizacji replikacja zmian różnicowych zostanie wznowiona.
Zasady replikacji
Po włączeniu replikacji maszyny wirtualnej platformy Azure usługa Site Recovery domyślnie tworzy nowe zasady replikacji z ustawieniami domyślnymi podsumowanymi w tabeli.
Ustawienie zasad | Szczegóły | Wartość domyślna |
---|---|---|
Przechowywanie punktów odzyskiwania | Określa, jak długo usługa Site Recovery przechowuje punkty odzyskiwania | 1 dzień |
Częstotliwość migawek spójnych na poziomie aplikacji | Jak często usługa Site Recovery tworzy migawkę spójną na poziomie aplikacji | Disabled |
Zarządzanie zasadami replikacji
Domyślne ustawienia zasad replikacji można zarządzać i modyfikować w następujący sposób:
- Ustawienia można modyfikować podczas włączania replikacji.
- Podczas próby włączenia replikacji można utworzyć lub edytować nowe zasady replikacji.
Spójność wielu maszyn wirtualnych
Jeśli chcesz, aby maszyny wirtualne były replikowane razem i współużytkowały punkty odzyskiwania spójne na poziomie awarii i spójne z aplikacjami w trybie failover, możesz zebrać je razem w grupie replikacji. Spójność wielu maszyn wirtualnych ma wpływ na wydajność obciążenia i powinna być używana tylko dla maszyn wirtualnych 4 obciążeń wymagających spójności na wszystkich maszynach.
Migawki i punkty odzyskiwania
Punkty odzyskiwania są tworzone na podstawie migawek dysków maszyn wirtualnych wykonanych w określonym punkcie w czasie. Podczas przełączania maszyny wirtualnej w tryb failover należy użyć punktu odzyskiwania, aby przywrócić maszynę wirtualną w lokalizacji docelowej.
W przypadku przełączania w tryb failover zwykle chcemy upewnić się, że maszyna wirtualna zaczyna się od braku uszkodzenia lub utraty danych, a dane maszyny wirtualnej są spójne dla systemu operacyjnego oraz aplikacji uruchamianych na maszynie wirtualnej. Zależy to od typu wykonanych migawek.
Usługa Site Recovery tworzy migawki w następujący sposób:
- Usługa Site Recovery domyślnie tworzy migawki spójne na poziomie awarii danych i migawki spójne z aplikacjami, jeśli określisz dla nich częstotliwość.
- Punkty odzyskiwania są tworzone na podstawie migawek i przechowywane zgodnie z ustawieniami przechowywania w zasadach replikacji.
Spójność
W poniższej tabeli opisano różne typy spójności.
Spójne na poziomie awarii
Opis | Szczegóły | Zalecenie |
---|---|---|
Migawka spójna na poziomie awarii przechwytuje dane, które znajdowały się na dysku podczas wykonywania migawki. Nie zawiera żadnych elementów w pamięci. Zawiera odpowiednik danych na dysku, które byłyby obecne, jeśli maszyna wirtualna uległa awarii lub przewód zasilania został ściągnięty z serwera w momencie utworzenia migawki. Spójność na poziomie awarii nie gwarantuje spójności danych dla systemu operacyjnego ani aplikacji na maszynie wirtualnej. |
Usługa Site Recovery domyślnie tworzy punkty odzyskiwania spójne na poziomie awarii co pięć minut. Tego ustawienia nie można zmodyfikować. |
Obecnie większość aplikacji może odzyskać się dobrze po punktach spójnych na poziomie awarii. Punkty odzyskiwania spójne na poziomie awarii są zwykle wystarczające dla replikacji systemów operacyjnych i aplikacji, takich jak serwery DHCP i serwery wydruku. |
Spójne na poziomie aplikacji
Opis | Szczegóły | Zalecenie |
---|---|---|
Punkty odzyskiwania spójne na poziomie aplikacji są tworzone na podstawie migawek spójnych na poziomie aplikacji. Migawka spójna na poziomie aplikacji zawiera wszystkie informacje w migawce spójnej na poziomie awarii oraz wszystkie dane w pamięci i w toku transakcji. |
Migawki spójne na poziomie aplikacji używają usługi kopiowania woluminów w tle (VSS): 1) Usługa Azure Site Recovery używa metody kopii zapasowej tylko do kopiowania (VSS_BT_COPY), która nie zmienia czasu tworzenia kopii zapasowej dziennika transakcji programu Microsoft SQL i numeru sekwencji 2) Po zainicjowaniu migawki usługa VSS wykonuje operację kopiowania na zapis (COW) na woluminie. 3) Przed wykonaniem operacji COW usługa VSS informuje każdą aplikację na maszynie, że musi opróżnić dane rezydenta pamięci na dysk. 4) Usługa VSS umożliwia następnie aplikacji do tworzenia kopii zapasowej/odzyskiwania po awarii (w tym przypadku usługi Site Recovery) odczytywanie danych migawki i kontynuowanie. |
Migawki spójne na poziomie aplikacji są wykonywane zgodnie z ową częstotliwością. Ta częstotliwość powinna być zawsze mniejsza niż ustawiona na potrzeby przechowywania punktów odzyskiwania. Jeśli na przykład zachowasz punkty odzyskiwania przy użyciu domyślnego ustawienia 24 godzin, należy ustawić częstotliwość na mniej niż 24 godziny. Są one bardziej złożone i trwa dłużej niż migawki spójne na poziomie awarii. Mają one wpływ na wydajność aplikacji uruchomionych na maszynie wirtualnej włączonej do replikacji. |
Proces pracy w trybie failover i podczas powrotu po awarii
Po skonfigurowaniu replikacji i uruchomieniu próbnego odzyskiwania po awarii (test pracy w trybie failover), aby sprawdzić, czy wszystko działa zgodnie z oczekiwaniami, możesz uruchomić tryb failover i powrót po awarii zgodnie z potrzebami.
Możesz uruchomić tryb failover dla pojedynczej maszyny lub utworzyć plan odzyskiwania, aby w tym samym czasie przejąć wiele maszyn wirtualnych w tryb failover. Zaletą planu odzyskiwania zamiast trybu failover pojedynczej maszyny jest:
- Zależności aplikacji można modelować, włączając wszystkie maszyny wirtualne w aplikacji w ramach jednego planu odzyskiwania.
- Możesz dodawać skrypty, elementy Runbook platformy Azure i wstrzymywać akcje ręczne.
Po wyzwoleniu początkowego trybu failover należy zatwierdzić go, aby rozpocząć uzyskiwanie dostępu do obciążenia z maszyny wirtualnej platformy Azure.
Po ponownym udostępnieniu podstawowej lokacji lokalnej można przygotować się do powrotu po awarii. Jeśli konieczne jest powrót po awarii dużych ilości ruchu, skonfiguruj nowe urządzenie replikacji usługi Azure Site Recovery.
- Etap 1. Ponowne włączanie ochrony maszyn wirtualnych platformy Azure w celu replikacji z platformy Azure z powrotem do lokalnych maszyn wirtualnych VMware.
- Etap 2. Uruchamianie trybu failover w lokacji lokalnej.
- Etap 3. Po powrocie obciążeń po awarii można ponownie włączyć replikację dla lokalnych maszyn wirtualnych.
Następne kroki
Wykonaj czynności opisane w tym samouczku , aby włączyć replikację oprogramowania VMware na platformę Azure.