Projektowanie pod kątem wysokiej dostępności za pomocą usługi Azure ExpressRoute
Usługa Azure ExpressRoute została zaprojektowana pod kątem wysokiej dostępności, zapewniając łączność sieci prywatnej klasy przewoźnika z zasobami firmy Microsoft. Oznacza to, że w sieci firmy Microsoft nie ma żadnego pojedynczego punktu awarii. Aby zmaksymalizować dostępność, zarówno segmenty klienta, jak i dostawcy usług obwodu usługi Azure ExpressRoute powinny być również zaprojektowane pod kątem wysokiej dostępności. W tym artykule opisano zagadnienia dotyczące architektury sieci służące do tworzenia niezawodnej łączności przy użyciu usługi Azure ExpressRoute i funkcji dostrajania w celu zwiększenia wysokiej dostępności obwodu usługi Azure ExpressRoute.
Uwaga
Koncepcje opisane w tym artykule mają zastosowanie równie niezależnie od tego, czy obwód usługi Azure ExpressRoute jest tworzony w usłudze Virtual WAN, czy poza nim.
Zagadnienia dotyczące architektury
Na poniższej ilustracji przedstawiono zalecany sposób nawiązywania połączenia przy użyciu obwodu usługi Azure ExpressRoute w celu zmaksymalizowania dostępności.
Aby zapewnić wysoką dostępność, należy zachować nadmiarowość w całej sieci kompleksowej. Oznacza to utrzymanie nadmiarowości w sieci lokalnej i brak kompromisu nadmiarowości w sieci dostawcy usług. Co najmniej polega to na unikaniu pojedynczych punktów awarii sieci. Nadmiarowe zasilanie i chłodzenie dla urządzeń sieciowych dodatkowo zwiększa wysoką dostępność.
Zagadnienia dotyczące projektowania warstwy fizycznej w pierwszej mili
W przypadku przerwania zarówno podstawowych, jak i pomocniczych połączeń obwodu usługi Azure ExpressRoute na tym samym sprzęcie lokalnym klienta (CPE), bezpieczeństwo wysokiej dostępności w sieci lokalnej zostanie naruszone. Ponadto skonfigurowanie obu połączeń przy użyciu tego samego portu CPE wymusza na partnerze naruszenie wysokiej dostępności w segmencie sieci. Może to wystąpić, przerywając dwa połączenia w różnych podpowierzchniach lub scalając dwa połączenia w sieci partnera, jak pokazano poniżej.
Przerywanie podstawowych i pomocniczych połączeń obwodu usługi Azure ExpressRoute w różnych lokalizacjach geograficznych może naruszyć wydajność sieci. Jeśli ruch jest aktywnie zrównoważony dla połączeń zakończonych w różnych lokalizacjach, znaczne różnice w opóźnieniu sieci między dwiema ścieżkami mogą spowodować nieoptymalną wydajność.
Aby zapoznać się z zagadnieniami dotyczącymi projektowania geograficznie nadmiarowego, zobacz Projektowanie pod kątem odzyskiwania po awarii za pomocą usługi Azure ExpressRoute.
Połączenia aktywne-aktywne
Sieć firmy Microsoft obsługuje podstawowe i pomocnicze połączenia obwodów usługi Azure ExpressRoute w trybie aktywny-aktywny. Można jednak wymusić działanie nadmiarowych połączeń w trybie aktywny-pasywny za pośrednictwem anonsów tras. Anonsowanie bardziej szczegółowych tras i dołączanie ścieżki AS protokołu BGP są typowymi technikami preferowania jednej ścieżki w drugiej.
Aby zwiększyć wysoką dostępność, zaleca się obsługę obu połączeń w trybie aktywny-aktywny. Dzięki temu sieć firmy Microsoft może równoważyć obciążenie ruchu między połączeniami na podstawie przepływu.
Uruchamianie połączeń w trybie aktywny-pasywny grozi niepowodzeniem obu połączeń, jeśli aktywna ścieżka zakończy się niepowodzeniem. Typowe przyczyny awarii obejmują brak aktywnego zarządzania pasywnym połączeniem i pasywnym anonsowanie nieaktualnych tras.
Alternatywnie uruchomienie połączeń w trybie aktywny-aktywny powoduje, że tylko połowa przepływów kończy się niepowodzeniem i jest przekierowywana, co znacznie poprawia średni czas odzyskiwania (MTTR).
Uwaga
Podczas konserwacji lub nieplanowanych zdarzeń wpływających na jedno połączenie firma Microsoft będzie używać ścieżki AS prepending w celu opróżnienia ruchu do połączenia w dobrej kondycji. Upewnij się, że ruch może być kierowany przez ścieżkę w dobrej kondycji, gdy wstępna ścieżka jest skonfigurowana przez firmę Microsoft, a wymagane anonse tras są odpowiednio ustawione, aby uniknąć zakłóceń w działaniu usługi.
Translator adresów sieciowych dla komunikacji równorzędnej firmy Microsoft
Komunikacja równorzędna firmy Microsoft jest przeznaczona do komunikacji między publicznymi punktami końcowymi. Zazwyczaj lokalne prywatne punkty końcowe to przetłumaczone adresy sieciowe (NATed) z publicznymi adresami IP w sieci klienta lub partnera przed komunikacją równorzędną firmy Microsoft. Użycie zarówno połączeń podstawowych, jak i pomocniczych w konfiguracji aktywne-aktywne wpływa na szybkość odzyskiwania po awarii w jednym z połączeń. Poniżej przedstawiono dwie różne opcje translatora adresów sieciowych:
Opcja 1:
Translator adresów sieciowych jest stosowany po podzieleniu ruchu między połączeniami podstawowymi i pomocniczymi. Niezależne pule TRANSLATOR adresów sieciowych są używane dla urządzeń podstawowych i pomocniczych w celu spełnienia wymagań stanowych translatora adresów sieciowych. Ruch powrotny dociera do tego samego urządzenia brzegowego, za pośrednictwem którego przepływ jest wychodzący.
Jeśli połączenie usługi Azure ExpressRoute zakończy się niepowodzeniem, odpowiednia pula translatora adresów sieciowych stanie się niedostępna, powodując niezgodność wszystkich przepływów sieciowych. Te przepływy muszą zostać ponownie ustanowione przez protokół TCP lub warstwę aplikacji po przekroczeniu limitu czasu okna. Podczas awarii platforma Azure nie może nawiązać połączenia z serwerami lokalnymi przy użyciu odpowiedniego translatora adresów sieciowych do momentu przywrócenia łączności.
Opcja 2.
Wspólna pula translatora adresów sieciowych jest używana przed podzieleniem ruchu między połączeniami podstawowymi i pomocniczymi. Nie wprowadza to pojedynczego punktu awarii, co zapewnia wysoką dostępność.
Pula translatora adresów sieciowych pozostaje osiągalna nawet wtedy, gdy połączenie podstawowe lub pomocnicze zakończy się niepowodzeniem, dzięki czemu warstwa sieciowa będzie przekierowywać pakiety i odzyskiwać je szybciej.
Uwaga
- Jeśli używasz opcji NAT 1 (niezależnych pul nat dla połączeń podstawowych i pomocniczych) i mapowania portu adresu IP z jednej puli NAT na serwer lokalny, serwer nie będzie dostępny za pośrednictwem obwodu usługi Azure ExpressRoute, jeśli odpowiednie połączenie nie powiedzie się.
- Kończenie połączeń BGP usługi Azure ExpressRoute na urządzeniach stanowych może powodować problemy z trybem failover podczas planowanej lub nieplanowanej konserwacji przez firmę Microsoft lub dostawcę usługi Azure ExpressRoute. Przetestuj konfigurację, aby zapewnić odpowiednie przejście w tryb failover, a jeśli to możliwe, zakończ sesje protokołu BGP na urządzeniach bezstanowych.
Precyzyjne dostrajanie funkcji prywatnej komunikacji równorzędnej
Ta sekcja zawiera przegląd opcjonalnych funkcji, które pomagają zwiększyć wysoką dostępność obwodu usługi Azure ExpressRoute, w zależności od wdrożenia platformy Azure i poufności na mtTR. W szczególności obejmuje wdrażanie bram sieci wirtualnej usługi Azure ExpressRoute z obsługą stref i dwukierunkowe wykrywanie przekazywania (BFD).
Bramy sieci wirtualnej usługi Azure ExpressRoute obsługujące strefę dostępności
Strefa dostępności w regionie świadczenia usługi Azure łączy domenę błędów i domenę aktualizacji. Aby uzyskać najwyższą odporność i dostępność, skonfiguruj strefowo nadmiarową bramę sieci wirtualnej usługi Azure ExpressRoute. Aby uzyskać więcej informacji, zobacz Informacje o strefowo nadmiarowych bramach sieci wirtualnych w usłudze Azure Strefy dostępności. Aby skonfigurować strefowo nadmiarową bramę sieci wirtualnej, zobacz Tworzenie strefowo nadmiarowej bramy sieci wirtualnej w usłudze Azure Strefy dostępności.
Skracanie czasu wykrywania błędów
Usługa Azure ExpressRoute obsługuje funkcję BFD za pośrednictwem prywatnej komunikacji równorzędnej, zmniejszając czas wykrywania błędów w sieci warstwy 2 między siecią Microsoft Enterprise Edge (MSEE) i ich sąsiadami BGP po stronie lokalnej z około 3 minut (ustawienie domyślne) do mniej niż sekundy. Szybkie wykrywanie błędów pomaga przyspieszyć odzyskiwanie. Aby uzyskać więcej informacji, zobacz Konfigurowanie BFD za pośrednictwem usługi Azure ExpressRoute.
Następne kroki
W tym artykule omówiono projektowanie pod kątem wysokiej dostępności obwodu usługi Azure ExpressRoute. Punkt komunikacji równorzędnej obwodu usługi Azure ExpressRoute jest przypięty do lokalizacji geograficznej i może mieć wpływ na katastrofalne awarie wpływające na całą lokalizację.
Aby zapoznać się z zagadnieniami projektowymi dotyczącymi tworzenia geograficznie nadmiarowej łączności sieciowej z siecią szkieletową firmy Microsoft, która może wytrzymać katastrofalne awarie wpływające na cały region, zobacz Projektowanie pod kątem odzyskiwania po awarii za pomocą prywatnej komunikacji równorzędnej usługi Azure ExpressRoute.