Wskazówki dotyczące planowanej konserwacji dla usługi ExpressRoute
Obwody usługi ExpressRoute i porty bezpośrednie są konfigurowane z podstawowym i pomocniczym połączeniem z urządzeniami microsoft Enterprise Edge (MSEE) w lokalizacjach komunikacji równorzędnej firmy Microsoft. Te połączenia są ustanawiane na fizycznie różnych urządzeniach, aby zapewnić niezawodną łączność ze środowiska lokalnego do zasobów platformy Azure, jeśli są planowane lub nieplanowane zdarzenia.
W tym artykule wyjaśniono, co się dzieje podczas konserwacji obwodu usługi ExpressRoute i udostępnia akcje, które należy podjąć, aby zminimalizować awarię usługi, której dotyczy planowana lub nieplanowana konserwacja.
Przygotowanie do konserwacji
Urządzenia MSEE przechodzą konserwację w celu poprawy niezawodności platformy, stosowania poprawek zabezpieczeń, zastępowania wadliwego sprzętu itp. Operacje konserwacji są wymagane na routerach microsoft Enterprise Edge (MSEE), aby ulepszyć usługi obwodu usługi ExpressRoute lub zastosować nowe wydanie oprogramowania. Działanie konserwacji jest planowane i zaplanowane z wyprzedzeniem, aby zminimalizować wpływ na usługi.
Odporność obwodu usługi ExpressRoute
Odporność obwodu usługi ExpressRoute jest osiągana przy użyciu dwóch połączeń z dwoma środowiskami MSEE w lokalizacji usługi ExpressRoute.
Firma Microsoft wymaga dwóch sesji protokołu BGP od dostawcy łączności lub brzegu sieci — jeden do każdego urządzenia MSEE. Aby zapewnić zgodność z umową SLA (umowa dotycząca poziomu usług) skojarzona z obwodem usługi ExpressRoute, należy ustanowić jednocześnie dwie sesje protokołu BGP między routerami MSEE i routerami brzegowymi.
Włączanie alertów dotyczących konserwacji
Po zaplanowaniu planowanej konserwacji otrzymasz powiadomienie co najmniej 14 dni przed oknem roboczym za pośrednictwem powiadomień usługi Azure Service Health. Za pomocą usługi Service Health można skonfigurować alerty dotyczące konserwacji obwodu usługi ExpressRoute, wyświetlania planowanej i zaplanowanej konserwacji. Aby dowiedzieć się więcej o konserwacji usługi Service Health dla usługi ExpressRoute, zobacz wyświetlanie i konfigurowanie alertów konserwacji usługi ExpressRoute. Ważne jest, aby subskrybować usługę Azure Service Health, aby otrzymywać informacje o zdarzeniach konserwacji.
Jak zaplanowano zdarzenia konserwacji
Planowana konserwacja na urządzeniu MSEE jest planowana w dwóch różnych oknach czasowych. To rozdzielenie polega na upewnieniu się, że łączność za pośrednictwem obwodów usługi ExpressRoute nie jest zakłócana z powodu zdarzenia konserwacji, a co najmniej jedna ścieżka jest zawsze dostępna, aby uzyskać dostęp do usług platformy Azure.
Podczas konserwacji włączamy wstępną ścieżkę AS, która umożliwia bezproblemowe opróżnianie ruchu do nadmiarowej ścieżki. Wstępna ścieżka as jest wykonywana przez wstępne dołączanie as 12076 (osiem razy) do tras protokołu BGP w kierunku lokalnego i połączenia bramy usługi ExpressRoute. Upewnij się, że wszystkie urządzenia lokalne w ścieżce są skonfigurowane tak, aby akceptowały wstępną ścieżkę AS i zezwalały na przenoszenie ruchu z środowiska lokalnego do nadmiarowej ścieżki usługi ExpressRoute.
Sprawdź dostawcę usług, aby potwierdzić, że zostały skonfigurowane, aby zezwolić na wstępną ścieżkę AS na połączeniach, jeśli zarządzają siecią.
Działanie konserwacji między routerami MSEE i siecią podstawową firmy Microsoft
Podczas działania konserwacji sesja protokołu BGP między siecią lokalną a protokołem MSEE może znajdować się w ustalonym stanie i trasach reklamowych z sieci lokalnej do routerów MSEE. W takim przypadku nie można polegać tylko na obecności ustalonej sesji protokołu BGP na routerze brzegowym w celu określenia integralności połączenia. Zasady routingu mogą wymuszać wysyłanie ruchu do określonego połączenia mimo to. Ta konfiguracja może spowodować odrzucenie ruchu, ponieważ ruch jest kierowany do połączenia, które jest poddawane konserwacji, a ruch powrotny przekracza nadmiarową ścieżkę. Aby uniknąć odrzucania ruchu, konfiguracja routerów brzegowych musi być skonfigurowana do przekazywania ruchu, gdy połączenie odbiera anonse protokołu BGP z as 12076 i z przekazywaniem ruchu do połączenia z najlepszą metryki protokołu BGP. Gdy metryka protokołu BGP w połączeniu podstawowym i pomocniczym jest taka sama, ruch jest zrównoważony.
Walidacja trybu failover obwodu usługi ExpressRoute
Po zakończeniu aktywacji obwodu usługi ExpressRoute i przed użyciem w środowisku produkcyjnym zalecane jest uruchomienie testu trybu failover w celu sprawdzenia, czy konfiguracje protokołu BGP routera brzegowego klienta są poprawne.
Proces weryfikacji trybu failover obwodu usługi ExpressRoute można wykonać w dwóch krokach:
Zamknij sesję protokołu BGP między lokalnym routerem brzegowym a podstawowym połączeniem na routerze MSEE. Wymusza to ruch tylko za pośrednictwem połączenia pomocniczego. Statystyki ruchu można monitorować w połączeniu MSEE przy użyciu
Get-AzExpressRouteCircuitStats
polecenia . Metryki ruchu BitsInPerSecond i BitsOutPerSecond powinny zwiększać tylko ścieżkę, która jest obecnie aktywna.Po pomyślnym zakończeniu testu przejdź do drugiego kroku.
Zamknij sesję protokołu BGP między lokalnym routerem brzegowym a pomocniczym połączeniem MSEE. Powtórz akcje weryfikacji w kroku 1, aby sprawdzić, czy ruch jest zwiększany tylko na ścieżce podstawowej.
Możesz uruchomić więcej testów, wprowadzając ścieżkę AS wstępną do każdej ścieżki ze środowiska lokalnego w kierunku urządzenia MSEE, aby zweryfikować tryb failover przepływu ruchu. Podobne testy można wykonać podczas pracy z dostawcą usług, aby wprowadzić ścieżkę AS wstępną do sieci lokalnej z poziomu brzegu dostawcy. Opisana procedura trybu failover powinna zostać zweryfikowana pod kątem prywatnej komunikacji równorzędnej usługi ExpressRoute i komunikacji równorzędnej firmy Microsoft usługi ExpressRoute.
Aby sprawdzić stan sesji protokołu BGP w teście trybu failover, możesz użyć wytycznych opisanych w dokumentacji weryfikowania łączności usługi ExpressRoute .
Weryfikacja trybu failover obwodu usługi ExpressRoute zmniejsza ryzyko awarii podczas planowanej konserwacji obwodów usługi ExpressRoute.
Jeśli weryfikacja trybu failover obwodu usługi ExpressRoute nie została ukończona, a obwód usługi ExpressRoute jest już w środowisku produkcyjnym, nigdy nie jest za późno, aby zaplanować konserwację klienta, poza godzinami pracy i kontynuować test trybu failover.
Uwaga
Ogólnie rzecz biorąc, kończenie połączeń BGP usługi ExpressRoute na urządzeniach stanowych (takich jak zapory) może powodować problemy z trybem failover podczas planowanych lub nieplanowanych konserwacji przez firmę Microsoft lub dostawcę usług ExpressRoute. Należy ocenić konfigurację, aby upewnić się, że ruch będzie działał prawidłowo w trybie failover, a jeśli to możliwe, zakończ sesje protokołu BGP na urządzeniach bezstanowych.
Monitorowanie obwodu usługi ExpressRoute
Należy śledzić stan połączeń za pośrednictwem obwodów usługi ExpressRoute. Śledzenie kondycji łączności sieciowej jest ważne, aby reagować na stan złej kondycji i podejmowania monitu o korygowanie. Alerty usługi Azure Monitor aktywnie powiadamiają Cię, gdy warunki powodujące negatywne skutki znajdują się w danych monitorowania.
Przejrzyj dostępne metryki monitorowania usługi ExpressRoute dla obwodu usługi ExpressRoute i portów bezpośrednich. Co najmniej należy skonfigurować alerty wyzwalające dostępność protokołu ARP, dostępność protokołu BGP i protokół liniowy. Następnie skonfiguruj powiadomienia e-mail, które mają być wysyłane po wystąpieniu poza usługą.
Możesz podnieść poziom informacji o monitorze przy użyciu Monitor połączenia dla usługi ExpressRoute. Monitor połączeń to oparte na chmurze rozwiązanie do monitorowania sieci, które monitoruje łączność między sieciami lokalnymi (oddziałami itp.) i wdrożeniami chmury platformy Azure. Ta usługa służy do śledzenia nie tylko przerw w działaniu usług, ale także kompleksowego obniżenia wydajności usług.
Następne kroki
- Dowiedz się więcej o usłudze Network Insights dla usługi ExpressRoute, aby monitorować obwód usługi ExpressRoute i rozwiązywać problemy z tym obwodem.