Progettazione per la disponibilità elevata con Azure ExpressRoute

Articolo
12/13/2024

Azure ExpressRoute è progettato per la disponibilità elevata, offrendo connettività di rete privata di livello operatore alle risorse Microsoft. Ciò significa che non esiste un singolo punto di errore all'interno della rete Microsoft. Per ottimizzare la disponibilità, è consigliabile progettare sia i segmenti dei clienti che dei provider di servizi del circuito Azure ExpressRoute per la disponibilità elevata. Questo articolo illustra le considerazioni sull'architettura di rete per la creazione di una connettività affidabile usando Azure ExpressRoute e le funzionalità di ottimizzazione per migliorare la disponibilità elevata del circuito Azure ExpressRoute.

Nota

I concetti descritti in questo articolo si applicano allo stesso modo se viene creato un circuito Azure ExpressRoute in rete WAN virtuale o all'esterno di esso.

Considerazioni sull'architettura

La figura seguente illustra il modo consigliato per connettersi usando un circuito Azure ExpressRoute per ottimizzare la disponibilità.

Per la disponibilità elevata, è essenziale mantenere la ridondanza in tutta la rete end-to-end. Ciò significa mantenere la ridondanza all'interno della rete locale e non compromettere la ridondanza all'interno della rete del provider di servizi. Come minimo, ciò comporta l'evitare singoli punti di errore di rete. L'alimentazione ridondante e il raffreddamento per i dispositivi di rete migliorano ulteriormente la disponibilità elevata.

Considerazioni sulla progettazione del livello fisico del primo miglio

Se si terminano sia le connessioni primarie che secondarie di un circuito Azure ExpressRoute nella stessa attrezzatura locale del cliente(CPE), si compromette la disponibilità elevata all'interno della rete locale. Inoltre, la configurazione di entrambe le connessioni usando la stessa porta di un CPE impone al partner di compromettere la disponibilità elevata nel segmento di rete. Ciò può verificarsi terminando le due connessioni in sottointerfazioni diverse o unendo le due connessioni all'interno della rete partner, come illustrato di seguito.

La terminazione delle connessioni primarie e secondarie di un circuito Azure ExpressRoute in posizioni geografiche diverse può compromettere le prestazioni di rete. Se il traffico è attivamente con carico bilanciato tra connessioni terminate in posizioni diverse, differenze sostanziali nella latenza di rete tra i due percorsi possono comportare prestazioni non ottimali.

Per considerazioni sulla progettazione con ridondanza geografica, vedere Progettazione per il ripristino di emergenza con Azure ExpressRoute.

Connessioni active-active

La rete Microsoft gestisce le connessioni primarie e secondarie dei circuiti Azure ExpressRoute in modalità attivo-attivo. Tuttavia, è possibile forzare le connessioni ridondanti a funzionare in modalità attiva-passiva tramite gli annunci di route. La pubblicità di route più specifiche e il pre-attesa del percorso BGP AS sono tecniche comuni per preferire un percorso rispetto all'altro.

Per migliorare la disponibilità elevata, è consigliabile usare entrambe le connessioni in modalità attiva-attiva. Ciò consente alla rete Microsoft di bilanciare il carico del traffico tra le connessioni in base al flusso.

L'esecuzione di connessioni in modalità attiva-passiva rischia l'esito negativo di entrambe le connessioni se il percorso attivo ha esito negativo. Le cause comuni dell'errore includono la mancanza di gestione attiva della connessione passiva e delle route non aggiornate della connessione passiva.

In alternativa, l'esecuzione di connessioni in modalità attiva-attiva comporta solo circa la metà dei flussi che hanno esito negativo e viene reindirizzato, migliorando significativamente il tempo medio per il ripristino (MTTR).

Nota

Durante la manutenzione o gli eventi non pianificati che influisce su una connessione, Microsoft userà il percorso AS in sospeso per svuotare il traffico verso la connessione integra. Assicurarsi che il traffico possa instradarsi sul percorso integro quando il percorso pre-sospeso è configurato da Microsoft e gli annunci di route necessari vengono impostati in modo appropriato per evitare interruzioni del servizio.

NAT per il peering Microsoft

Il peering Microsoft è progettato per la comunicazione tra endpoint pubblici. In genere, gli endpoint privati locali sono Network Address Translated (NATed) con indirizzi IP pubblici nel cliente o nella rete partner prima di comunicare tramite peering Microsoft. L'uso di connessioni primarie e secondarie in un'installazione attiva influisce sulla velocità di ripristino da un errore in una delle connessioni. Di seguito sono illustrate due diverse opzioni NAT:

Opzione 1:

NAT viene applicato dopo la suddivisione del traffico tra le connessioni primarie e secondarie. I pool NAT indipendenti vengono usati per i dispositivi primari e secondari per soddisfare i requisiti NAT con stato. Il traffico di ritorno arriva sullo stesso dispositivo perimetrale attraverso il quale il flusso è in uscita.

Se una connessione Di Azure ExpressRoute non riesce, il pool NAT corrispondente diventa non raggiungibile, interrompendo tutti i flussi di rete. Questi flussi devono essere ristabiliti da TCP o dal livello applicazione dopo il timeout dell'intervallo. Durante l'errore, Azure non riesce a raggiungere i server locali usando il nat corrispondente fino a quando non viene ripristinata la connettività.

Opzione 2:

Prima di suddividere il traffico tra le connessioni primarie e secondarie, viene usato un pool NAT comune. Questo non introduce un singolo punto di errore, mantenendo quindi la disponibilità elevata.

Il pool NAT rimane raggiungibile anche se la connessione primaria o secondaria ha esito negativo, consentendo al livello di rete di reindirizzare i pacchetti e ripristinare più velocemente.

Nota

Se si usa l'opzione NAT 1 (pool NAT indipendenti per le connessioni primarie e secondarie) e si esegue il mapping di una porta di un indirizzo IP da un pool NAT a un server locale, il server non sarà raggiungibile tramite il circuito Azure ExpressRoute se la connessione corrispondente non riesce.
La terminazione delle connessioni BGP di Azure ExpressRoute nei dispositivi con stato può causare problemi di failover durante la manutenzione pianificata o non pianificata da Microsoft o dal provider Azure ExpressRoute. Testare la configurazione per garantire il failover corretto e, quando possibile, terminare le sessioni BGP nei dispositivi senza stato.

Funzionalità di ottimizzazione per il peering privato

Questa sezione esamina le funzionalità facoltative che consentono di migliorare la disponibilità elevata del circuito Azure ExpressRoute, a seconda della distribuzione di Azure e della sensibilità a MTTR. In particolare, viene illustrata la distribuzione compatibile con la zona dei gateway di rete virtuale di Azure ExpressRoute e del rilevamento dell'inoltro bidirezionale (BFD).

Gateway di rete virtuale con riconoscimento della zona di disponibilità di Azure ExpressRoute

Una zona di disponibilità in un'area di Azure combina un dominio di errore e un dominio di aggiornamento. Per ottenere la massima resilienza e disponibilità, configurare un gateway di rete virtuale Azure ExpressRoute con ridondanza della zona. Per altre informazioni, vedere Informazioni sui gateway di rete virtuale con ridondanza della zona in Azure zone di disponibilità. Per configurare un gateway di rete virtuale con ridondanza della zona, vedere Creare un gateway di rete virtuale con ridondanza della zona nelle zone di disponibilità di Azure.

Miglioramento del tempo di rilevamento degli errori

Azure ExpressRoute supporta BFD tramite peering privato, riducendo il tempo di rilevamento degli errori nella rete di livello 2 tra Microsoft Enterprise Edge (MSEE) e i relativi vicini BGP sul lato locale da circa 3 minuti (impostazione predefinita) a meno di un secondo. Il rilevamento rapido degli errori consente di accelerare il ripristino. Per altre informazioni, vedere Configurare BFD su Azure ExpressRoute.

Passaggi successivi

Questo articolo ha illustrato la progettazione per la disponibilità elevata di un circuito Azure ExpressRoute. Un punto di peering del circuito ExpressRoute di Azure viene aggiunto a una posizione geografica e può essere influenzato da errori irreversibili che influiscono sull'intera posizione.

Per considerazioni sulla progettazione per creare la connettività di rete con ridondanza geografica al backbone Microsoft che può resistere a errori irreversibili che interessano un'intera area, vedere Progettazione per il ripristino di emergenza con il peering privato di Azure ExpressRoute.

Condividi tramite

Progettazione per la disponibilità elevata con Azure ExpressRoute

Considerazioni sull'architettura

Considerazioni sulla progettazione del livello fisico del primo miglio

Connessioni active-active

NAT per il peering Microsoft

Opzione 1:

Opzione 2:

Funzionalità di ottimizzazione per il peering privato

Gateway di rete virtuale con riconoscimento della zona di disponibilità di Azure ExpressRoute

Miglioramento del tempo di rilevamento degli errori

Passaggi successivi

Commenti e suggerimenti

Risorse aggiuntive