Designa för hög tillgänglighet med Azure ExpressRoute
Azure ExpressRoute är utformat för hög tillgänglighet, vilket ger privata nätverksanslutningar i transportföretagsklass till Microsoft-resurser. Det innebär att det inte finns någon enskild felpunkt i Microsoft-nätverket. För att maximera tillgängligheten bör både kund- och tjänstleverantörssegmenten i din Azure ExpressRoute-krets också utformas för hög tillgänglighet. Den här artikeln beskriver nätverksarkitekturens överväganden för att skapa robusta anslutningar med hjälp av Azure ExpressRoute och finjustera funktioner för att förbättra den höga tillgängligheten för din Azure ExpressRoute-krets.
Kommentar
Begreppen som beskrivs i den här artikeln gäller även om en Azure ExpressRoute-krets skapas under Virtual WAN eller utanför den.
Arkitekturöverväganden
Följande bild illustrerar det rekommenderade sättet att ansluta med hjälp av en Azure ExpressRoute-krets för att maximera tillgängligheten.
För hög tillgänglighet är det viktigt att bibehålla redundans i hela nätverket från slutpunkt till slutpunkt. Det innebär att bibehålla redundans i ditt lokala nätverk och inte äventyra redundansen i tjänstleverantörens nätverk. Detta innebär åtminstone att du undviker enskilda nätverksfel. Redundant ström och kylning för nätverksenheter förbättrar ytterligare hög tillgänglighet.
Designöverväganden för första milens fysiska lager
Om du avslutar både de primära och sekundära anslutningarna för en Azure ExpressRoute-krets på samma CPE (Customer Premises Equipment) äventyrar du hög tillgänglighet i ditt lokala nätverk. Dessutom tvingar konfigurationen av båda anslutningarna med samma port för en CPE partnern att äventyra hög tillgänglighet i nätverkssegmentet. Detta kan inträffa genom att avsluta de två anslutningarna under olika undergränssnitt eller slå samman de två anslutningarna i partnernätverket, enligt nedan.
Om du avslutar de primära och sekundära anslutningarna för en Azure ExpressRoute-krets på olika geografiska platser kan nätverksprestandan försämras. Om trafiken aktivt lastbalanseras mellan anslutningar som avslutas på olika platser kan betydande skillnader i nätverksfördröjning mellan de två sökvägarna resultera i underoptimala prestanda.
Geo-redundanta designöverväganden finns i Designa för haveriberedskap med Azure ExpressRoute.
Aktiva anslutningar
Microsoft-nätverket driver de primära och sekundära anslutningarna för Azure ExpressRoute-kretsar i aktivt-aktivt läge. Du kan dock tvinga de redundanta anslutningarna att fungera i aktivt-passivt läge via dina vägannonser. Annonsering av mer specifika vägar och BGP AS-sökvägsprepending är vanliga tekniker för att föredra den ena vägen framför den andra.
För att förbättra hög tillgänglighet rekommenderar vi att du använder båda anslutningarna i aktivt-aktivt läge. På så sätt kan Microsoft-nätverket belastningsutjämningstrafik mellan anslutningarna per flöde.
Att köra anslutningar i aktivt-passivt läge riskerar att båda anslutningarna misslyckas om den aktiva sökvägen misslyckas. Vanliga orsaker till fel är brist på aktiv hantering av passiv anslutning och passiva anslutningsannonsering av inaktuella vägar.
Om du kör anslutningar i aktivt-aktivt läge resulterar det också i att endast ungefär hälften av flödena misslyckas och omdirigeras, vilket avsevärt förbättrar MTTR (Mean Time To Recover).
Kommentar
Under underhåll eller oplanerade händelser som påverkar en anslutning använder Microsoft DEN AS-sökväg som väntar på att tömma trafiken till den felfria anslutningen. Se till att trafiken kan dirigeras över den felfria sökvägen när sökvägens prepending konfigureras av Microsoft och nödvändiga vägannonser anges på lämpligt sätt för att undvika avbrott i tjänsten.
NAT för Microsoft-peering
Microsoft-peering är utformat för kommunikation mellan offentliga slutpunkter. Vanligtvis är lokala privata slutpunkter nätverksadressöversatt (NATed) med offentliga IP-adresser i kundens eller partnernätverket innan de kommunicerar via Microsoft-peering. Användning av både primära och sekundära anslutningar i en aktiv-aktiv konfiguration påverkar hur snabbt du återställer från ett fel i en av anslutningarna. Två olika NAT-alternativ visas nedan:
Alternativ 1:
NAT tillämpas efter att trafiken har delats mellan de primära och sekundära anslutningarna. Oberoende NAT-pooler används för att de primära och sekundära enheterna ska uppfylla tillståndskänsliga NAT-krav. Returtrafiken kommer till samma gränsenhet genom vilken flödet utgick.
Om en Azure ExpressRoute-anslutning misslyckas blir motsvarande NAT-pool oåtkomlig och bryter alla nätverksflöden. Dessa flöden måste återupprättas av TCP eller programskiktet efter tidsgränsen för fönstret. Under felet kan Azure inte nå lokala servrar med hjälp av motsvarande NAT förrän anslutningen har återställts.
Alternativ 2:
En vanlig NAT-pool används innan trafiken delas mellan de primära och sekundära anslutningarna. Detta medför inte en enda felpunkt, vilket ger hög tillgänglighet.
NAT-poolen kan fortfarande nås även om den primära eller sekundära anslutningen misslyckas, vilket gör att nätverksskiktet kan omdirigera paket och återställa snabbare.
Kommentar
- Om du använder NAT-alternativ 1 (oberoende NAT-pooler för primära och sekundära anslutningar) och mappar en port för en IP-adress från en NAT-pool till en lokal server, kan servern inte nås via Azure ExpressRoute-kretsen om motsvarande anslutning misslyckas.
- Om du avslutar Azure ExpressRoute BGP-anslutningar på tillståndskänsliga enheter kan det orsaka redundansproblem under planerat eller oplanerat underhåll av Microsoft eller din Azure ExpressRoute-provider. Testa konfigurationen för att säkerställa korrekt redundans och avsluta BGP-sessioner på tillståndslösa enheter när det är möjligt.
Finjusteringsfunktioner för privat peering
Det här avsnittet granskar valfria funktioner som hjälper till att förbättra den höga tillgängligheten för din Azure ExpressRoute-krets, beroende på din Azure-distribution och känslighet för MTTR. Mer specifikt omfattar den zonmedveten distribution av virtuella Azure ExpressRoute-nätverksgatewayer och BFD (Bidirectional Forwarding Detection).
Tillgänglighetszonmedvetna virtuella Azure ExpressRoute-nätverksgatewayer
En tillgänglighetszon i en Azure-region kombinerar en feldomän och en uppdateringsdomän. För att uppnå högsta återhämtning och tillgänglighet konfigurerar du en zonredundant virtuell Nätverksgateway för Azure ExpressRoute. Mer information finns i Om zonredundanta virtuella nätverksgatewayer i Azure Tillgänglighetszoner. Information om hur du konfigurerar en zonredundant virtuell nätverksgateway finns i Skapa en zonredundant virtuell nätverksgateway i Azure Tillgänglighetszoner.
Förbättra tiden för felidentifiering
Azure ExpressRoute stöder BFD över privat peering, vilket minskar tiden för felidentifiering över Layer 2-nätverket mellan Microsoft Enterprise Edge (MSEEs) och deras BGP-grannar på den lokala sidan från cirka 3 minuter (standard) till mindre än en sekund. Snabb felidentifiering hjälper till att påskynda återställningen. Mer information finns i Konfigurera BFD via Azure ExpressRoute.
Nästa steg
I den här artikeln beskrivs design för hög tillgänglighet för en Azure ExpressRoute-krets. En Azure ExpressRoute-kretspeeringspunkt fästs på en geografisk plats och kan påverkas av katastrofala fel som påverkar hela platsen.
Designöverväganden för att skapa geo-redundant nätverksanslutning till Microsofts stamnät som kan motstå katastrofala fel som påverkar en hel region finns i Designa för haveriberedskap med privat Peering i Azure ExpressRoute.