Designa för hög tillgänglighet med ExpressRoute
ExpressRoute är utformat för hög tillgänglighet för att tillhandahålla privata nätverksanslutningar i operatörsklass för Microsoft-resurser. Det finns med andra ord ingen enskild felpunkt i ExpressRoute-sökvägen i Microsoft-nätverket. För att maximera tillgängligheten bör kunden och tjänsteleverantörssegmentet i ExpressRoute-kretsen också utformas för hög tillgänglighet. I den här artikeln ska vi först titta på nätverksarkitekturens överväganden för att skapa en robust nätverksanslutning med hjälp av en ExpressRoute, sedan ska vi titta på de finjusteringsfunktioner som hjälper dig att förbättra den höga tillgängligheten för din ExpressRoute-krets.
Kommentar
Begreppen som beskrivs i den här artikeln gäller även när en ExpressRoute-krets skapas under Virtual WAN eller utanför den.
Arkitekturöverväganden
Följande bild illustrerar det rekommenderade sättet att ansluta med hjälp av en ExpressRoute-krets för att maximera tillgängligheten för en ExpressRoute-krets.
För hög tillgänglighet är det viktigt att behålla redundansen för ExpressRoute-kretsen i hela nätverket från slutpunkt till slutpunkt. Med andra ord måste du behålla redundansen i ditt lokala nätverk och bör inte äventyra redundansen i tjänstleverantörens nätverk. Att upprätthålla redundansen minst innebär att man undviker en enda plats med nätverksfel. Om du har redundant ström och kylning för nätverksenheterna förbättras den höga tillgängligheten ytterligare.
Designöverväganden för första milens fysiska lager
Om du avslutar både de primära och sekundära anslutningarna för en ExpressRoute-krets på samma kundlokal utrustning (CPE) äventyrar du den höga tillgängligheten i ditt lokala nätverk. Om du konfigurerar både de primära och sekundära anslutningarna med samma port för en CPE tvingar du även partnern att äventyra hög tillgänglighet i nätverkssegmentet. Den här händelsen kan inträffa genom att antingen avsluta de två anslutningarna under olika undergränssnitt eller genom att slå samman de två anslutningarna i partnernätverket. Den här kompromissen illustreras i följande bild.
Om du däremot avslutar de primära och sekundära anslutningarna för en ExpressRoute-krets på olika geografiska platser kan du äventyra nätverksprestandan för anslutningen. Om trafiken aktivt lastbalanseras över den primära och sekundära anslutningar som avslutas på olika geografiska platser, skulle potentiell betydande skillnad i nätverksfördröjning mellan de två sökvägarna resultera i suboptimal nätverksprestanda.
Geo-redundanta designöverväganden finns i Designa för haveriberedskap med ExpressRoute.
Aktiva anslutningar
Microsoft-nätverket är konfigurerat för att hantera de primära och sekundära anslutningarna för ExpressRoute-kretsar i läget aktiv-aktiv. Men via dina routningsmeddelanden kan du tvinga redundanta anslutningar för en ExpressRoute-krets att köras i läget aktiv-passiv. Annonsering av mer specifika vägar och BGP AS-sökvägsförberedelser är vanliga tekniker som används för att prioritera en väg före en annan.
För att få ännu högre tillgänglighet rekommenderar vi att du använder båda anslutningarna för en ExpressRoute-krets i läget aktiv-aktiv. Om du kör anslutningarna i läget aktiv-aktiv belastningsutjämnar Microsoft-nätverket trafiken mellan anslutningarna per flöde.
Om du kör de primära och sekundära anslutningarna för en ExpressRoute-krets i aktivt-passivt läge riskerar båda anslutningarna att misslyckas efter ett fel i den aktiva sökvägen. De vanligaste orsakerna till fel vid växling är brist på aktiv hantering av den passiva anslutningen och passiva anslutningsannonsering av inaktuella vägar.
Alternativt kan du köra de primära och sekundära anslutningarna för en ExpressRoute-krets i aktivt-aktivt läge, vilket resulterar i att endast ungefär hälften av flödena misslyckas och omdirigeras igen. Därför bidrar en aktiv-aktiv anslutning avsevärt till att förbättra mediantiden för återhämtning (MTTR).
Kommentar
Under en underhållsaktivitet eller vid oplanerade händelser som påverkar en av anslutningarna föredrar Microsoft att använda AS-sökvägen som väntar för att tömma trafiken på den felfria anslutningen. Du måste se till att trafiken kan dirigeras över den felfria sökvägen när sökvägsförberedelser konfigureras från Microsoft och nödvändiga vägannonser konfigureras på lämpligt sätt för att undvika avbrott i tjänsten.
NAT för Microsoft-peering
Microsoft-peering är utformat för kommunikation mellan offentliga slutpunkter. Lokala privata slutpunkter är därför vanligtvis nätverksadressöversatt (NATed) med offentlig IP-adress i kundens eller partnernätverket innan de kommunicerar via Microsoft-peering. Förutsatt att du använder både de primära och sekundära anslutningarna i en aktiv-aktiv installation. Var och hur din NAT påverkar hur snabbt du återställer efter ett fel i någon av ExpressRoute-anslutningarna. Två olika NAT-alternativ visas i följande bild:
Alternativ 1:
NAT tillämpas efter att trafiken har delats mellan de primära och sekundära anslutningarna i ExpressRoute-kretsen. För att uppfylla de tillståndskänsliga kraven för NAT används oberoende NAT-pooler för de primära och sekundära enheterna. Returtrafiken kommer till samma gränsenhet genom vilken flödet utgick.
Om ExpressRoute-anslutningen misslyckas bryts möjligheten att nå motsvarande NAT-pool. Därför måste alla brutna nätverksflöden återupprättas antingen av TCP eller av programskiktet efter motsvarande tidsgräns för fönstret. Under felet kan Azure inte nå de lokala servrarna med hjälp av motsvarande NAT förrän anslutningen har återställts för antingen de primära eller sekundära anslutningarna i ExpressRoute-kretsen.
Alternativ 2:
En vanlig NAT-pool används innan trafiken delas mellan de primära och sekundära anslutningarna i ExpressRoute-kretsen. Det är viktigt att göra åtskillnad mellan att den gemensamma NAT-poolen innan du delar upp trafiken inte innebär att den introducerar en enskild felpunkt, vilket innebär att hög tillgänglighet äventyras.
NAT-poolen kan nås även efter att den primära eller sekundära anslutningen misslyckas. Så själva nätverksskiktet kan omdirigera paketen och hjälpa till att återställa snabbare efter ett fel.
Kommentar
- Om du använder NAT-alternativ 1 (oberoende NAT-pooler för primära och sekundära ExpressRoute-anslutningar) och mappar en port för en IP-adress från en av NAT-poolen till en lokal server kan servern inte nås via ExpressRoute-kretsen när motsvarande anslutning misslyckas.
- Om du avslutar ExpressRoute BGP-anslutningar på tillståndskänsliga enheter kan det orsaka problem med redundans under planerat eller oplanerat underhåll av Microsoft eller din ExpressRoute-provider. Du bör testa din konfiguration för att säkerställa att trafiken redundansväxlar korrekt och när det är möjligt avsluta BGP-sessioner på tillståndslösa enheter.
Finjusteringsfunktioner för privat peering
I det här avsnittet ska vi granska valfria (beroende på din Azure-distribution och hur känslig du är för MTTR)-funktioner som bidrar till att förbättra hög tillgänglighet för din ExpressRoute-krets. Mer specifikt ska vi granska zonmedveten distribution av virtuella ExpressRoute-nätverksgatewayer och BFD (Bidirectional Forwarding Detection).
Tillgänglighetszonmedvetna virtuella ExpressRoute-nätverksgatewayer
En tillgänglighetszon i en Azure-region är en kombination av en feldomän och en uppdateringsdomän. För att uppnå högsta återhämtning och tillgänglighet bör du konfigurera en zonredundant virtuell ExpressRoute-nätverksgateway. Mer information finns i Om zonredundanta virtuella nätverksgatewayer i Azure-tillgänglighetszoner. Information om hur du konfigurerar en zonredundant virtuell nätverksgateway finns i Skapa en zonredundant virtuell nätverksgateway i Azure-tillgänglighetszoner.
Förbättra tiden för felidentifiering
ExpressRoute stöder BFD över privat peering. BFD minskar identifieringstiden för fel i Layer 2-nätverket mellan Microsoft Enterprise Edge (MSEE) och deras BGP-grannar på den lokala sidan från cirka 3 minuter (standard) till mindre än en sekund. Snabb identifieringstid för fel hjälper till att påskynda återställning av fel. Mer information finns i Konfigurera BFD via ExpressRoute.
Nästa steg
I den här artikeln diskuterade vi hur du utformar för hög tillgänglighet för en ExpressRoute-kretsanslutning. En ExpressRoute-kretspeeringspunkt fästs på en geografisk plats och påverkas därför av oåterkalleliga fel som påverkar hela platsen.
Designöverväganden för att skapa geo-redundant nätverksanslutning till Microsofts stamnät som kan motstå katastrofala fel, som påverkar en hel region, finns i Designa för haveriberedskap med expressroute-privat peering.