Diseño de alta disponibilidad con Azure ExpressRoute
Azure ExpressRoute está diseñado para alta disponibilidad, lo que proporciona conectividad de red privada de nivel de operador a los recursos de Microsoft. Esto significa que no hay un único punto de error dentro de la red de Microsoft. Para maximizar la disponibilidad, los segmentos de proveedor de servicios y clientes del circuito de Azure ExpressRoute también deben diseñarse para lograr una alta disponibilidad. En este artículo se describen las consideraciones de arquitectura de red para crear una conectividad sólida mediante Azure ExpressRoute y las características de ajuste para mejorar la alta disponibilidad del circuito de Azure ExpressRoute.
Nota:
Los conceptos descritos en este artículo se aplican igualmente si se crea un circuito ExpressRoute de Azure en Virtual WAN o fuera de él.
Consideraciones sobre la arquitectura
En la ilustración siguiente se muestra la manera recomendada de conectarse mediante un circuito ExpressRoute de Azure para maximizar la disponibilidad.
Para lograr una alta disponibilidad, es esencial mantener la redundancia en toda la red de un extremo a otro. Esto significa mantener la redundancia dentro de la red local y no poner en peligro la redundancia dentro de la red del proveedor de servicios. Como mínimo, esto implica evitar puntos únicos de error de red. La alimentación redundante y la refrigeración de los dispositivos de red mejoran aún más la alta disponibilidad.
Consideraciones de diseño del nivel físico de la primera milla
Si finaliza las conexiones principales y secundarias de un circuito ExpressRoute de Azure en el mismo equipo local (CPE), pone en peligro la alta disponibilidad dentro de la red local. Además, la configuración de ambas conexiones mediante el mismo puerto de un CPE obliga al asociado a poner en peligro la alta disponibilidad en su segmento de red. Esto puede ocurrir si finaliza las dos conexiones en subinterfaces diferentes o combina las dos conexiones dentro de la red del asociado, como se muestra a continuación.
La terminación de las conexiones principales y secundarias de un circuito de Azure ExpressRoute en diferentes ubicaciones geográficas puede poner en peligro el rendimiento de la red. Si el tráfico se carga equilibradamente a través de conexiones terminadas en diferentes ubicaciones, las diferencias sustanciales en la latencia de red entre las dos rutas de acceso pueden dar lugar a un rendimiento poco óptimo.
Para conocer las consideraciones de diseño con redundancia geográfica, consulte Diseño para la recuperación ante desastres con Azure ExpressRoute.
Conexiones activas-activas
La red de Microsoft opera las conexiones principales y secundarias de los circuitos de Azure ExpressRoute en modo activo-activo. Sin embargo, puede forzar las conexiones redundantes para que funcionen en modo activo-pasivo a través de los anuncios de ruta. La publicidad de rutas más específicas y la pendiente de ruta de acceso de BGP AS son técnicas comunes para preferir una ruta de acceso sobre la otra.
Para mejorar la alta disponibilidad, se recomienda operar ambas conexiones en modo activo-activo. Esto permite que la red de Microsoft equilibre la carga del tráfico entre las conexiones por flujo.
La ejecución de conexiones en modo activo-pasivo corre el riesgo de que ambas conexiones produzcan errores si se produce un error en la ruta de acceso activa. Entre las causas comunes de error se incluyen la falta de administración activa de la conexión pasiva y las rutas obsoletas de publicidad de la conexión pasiva.
Como alternativa, la ejecución de conexiones en modo activo-activo produce un error de aproximadamente la mitad de los flujos y se vuelve a enrutar, lo que mejora significativamente el Tiempo medio de recuperación (MTTR).
Nota:
Durante el mantenimiento o eventos no planeados que afectan a una conexión, Microsoft usará la ruta de acceso as prepending para purgar el tráfico a la conexión correcta. Asegúrese de que el tráfico puede enrutarse a través de la ruta de acceso correcta cuando Microsoft configura la ruta de acceso pendiente y los anuncios de ruta necesarios se establecen correctamente para evitar interrupciones del servicio.
NAT para el emparejamiento de Microsoft
El emparejamiento de Microsoft está diseñado para la comunicación entre puntos de conexión públicos. Normalmente, los puntos de conexión privados locales son direcciones de red traducidas (NATed) con direcciones IP públicas en el cliente o la red de asociados antes de comunicarse a través del emparejamiento de Microsoft. El uso de conexiones principales y secundarias en una configuración activa-activa afecta a la rapidez con la que se recupera de un error en una de las conexiones. A continuación se muestran dos opciones NAT diferentes:
Opción 1:
NAT se aplica después de dividir el tráfico entre las conexiones principal y secundaria. Los grupos NAT independientes se usan para los dispositivos principales y secundarios para cumplir los requisitos de NAT con estado. El tráfico devuelto llega al mismo dispositivo perimetral a través del cual el flujo se ha saliente.
Si se produce un error en una conexión de Azure ExpressRoute, el grupo NAT correspondiente deja de ser accesible y se rompen todos los flujos de red. Estos flujos deben volver a establecerse mediante TCP o la capa de aplicación después del tiempo de espera de la ventana. Durante el error, Azure no puede acceder a los servidores locales mediante la NAT correspondiente hasta que se restaure la conectividad.
Opción 2:
Se usa un grupo NAT común antes de dividir el tráfico entre las conexiones principal y secundaria. Esto no introduce un único punto de error, por lo que se mantiene la alta disponibilidad.
El grupo NAT sigue siendo accesible incluso si se produce un error en la conexión principal o secundaria, lo que permite que la capa de red vuelva a enrutar paquetes y se recupere más rápido.
Nota:
- Si usa la opción NAT 1 (grupos NAT independientes para conexiones principales y secundarias) y asigna un puerto de una dirección IP de un grupo NAT a un servidor local, el servidor no será accesible a través del circuito de Azure ExpressRoute si se produce un error en la conexión correspondiente.
- La terminación de conexiones BGP de Azure ExpressRoute en dispositivos con estado puede provocar problemas de conmutación por error durante el mantenimiento planeado o no planeado por Microsoft o el proveedor de Azure ExpressRoute. Pruebe la configuración para garantizar una conmutación por error adecuada y, cuando sea posible, finalice las sesiones de BGP en dispositivos sin estado.
Características de ajuste preciso para el emparejamiento privado
En esta sección se revisan las características opcionales que ayudan a mejorar la alta disponibilidad del circuito de Azure ExpressRoute, en función de la implementación y la confidencialidad de Azure a MTTR. En concreto, abarca la implementación con reconocimiento de zona de puertas de enlace de red virtual de Azure ExpressRoute y detección de reenvío bidireccional (BFD).
Puertas de enlace de red virtual de Azure ExpressRoute compatibles con zonas de disponibilidad
Una zona de disponibilidad en una región de Azure combina un dominio de error y un dominio de actualización. Para lograr la máxima resistencia y disponibilidad, configure una puerta de enlace de red virtual de Azure ExpressRoute con redundancia de zona. Para más información, consulte Acerca de las puertas de enlace de red virtual con redundancia de zona en Azure Availability Zones. Para configurar una puerta de enlace de red virtual con redundancia de zona, consulte Creación de una puerta de enlace de red virtual con redundancia de zona en Azure Availability Zones.
Mejorar el tiempo de detección de errores
Azure ExpressRoute admite BFD a través del emparejamiento privado, lo que reduce el tiempo de detección de errores a través de la red de nivel 2 entre Microsoft Enterprise Edge (MSE) y sus vecinos BGP en el lado local de aproximadamente 3 minutos (valor predeterminado) a menos de un segundo. La detección rápida de errores ayuda a reducir la recuperación. Para más información, consulte Configuración de BFD a través de Azure ExpressRoute.
Pasos siguientes
En este artículo se describe el diseño de alta disponibilidad de un circuito ExpressRoute de Azure. Un punto de emparejamiento de circuitos ExpressRoute de Azure se ancla a una ubicación geográfica y puede verse afectado por errores catastróficos que afectan a toda la ubicación.
Para conocer las consideraciones de diseño para crear conectividad de red con redundancia geográfica a la red troncal de Microsoft que puede soportar errores catastróficos que afectan a toda una región, consulte Diseño para la recuperación ante desastres con el emparejamiento privado de Azure ExpressRoute.