Projetar e arquitetar o Azure ExpressRoute para resiliência
O Azure ExpressRoute é um serviço de conectividade híbrida essencial amplamente utilizado pela sua conectividade privada de baixa latência, resiliência e elevada taxa de transferência entre a sua rede local e as cargas de trabalho do Azure. Ele oferece a capacidade de obter confiabilidade, resiliência e recuperação de desastres em conexões de rede entre o local e o Azure para garantir a disponibilidade de cargas de trabalho de negócios e de missão crítica. Esse recurso também estende o acesso aos recursos do Azure de forma escalável e econômica.
Conexões de rede altamente confiáveis, resilientes e disponíveis são fundamentais para um sistema bem estruturado. A fiabilidade consiste em dois princípios: resiliência e disponibilidade. O objetivo da resiliência é evitar falhas e, caso ocorram, restaurar as suas aplicações para um estado totalmente operacional. O objetivo da disponibilidade é fornecer acesso consistente ao seu aplicativo ou cargas de trabalho. É importante planejar proativamente a confiabilidade com base nas necessidades do seu negócio e nos requisitos do aplicativo.
Os usuários do ExpressRoute dependem da disponibilidade e do desempenho de sites de borda, WAN e zonas de disponibilidade para manter sua conectividade com o Azure. No entanto, esses componentes ou locais podem sofrer falhas devido a vários motivos, como mau funcionamento do equipamento, interrupções na rede, condições climáticas ou desastres naturais. Portanto, é uma responsabilidade conjunta entre os usuários e seu provedor de nuvem, ao planejar confiabilidade, resiliência e disponibilidade.
Resiliência do site para ExpressRoute
Há três arquiteturas de resiliência da Rota Expressa que podem ser utilizadas para garantir alta disponibilidade e resiliência em suas conexões de rede entre o local e o Azure. Esses projetos de arquitetura incluem:
Máxima resiliência
A arquitetura de resiliência máxima no ExpressRoute é estruturada para eliminar qualquer ponto único de falha no caminho de rede da Microsoft. Essa configuração é obtida através da configuração de um par de circuitos em dois locais distintos para a diversidade de sites com o ExpressRoute. O objetivo da resiliência máxima é aumentar a confiabilidade, resiliência e disponibilidade, como resultado, garantindo o mais alto nível de resiliência para cargas de trabalho de negócios e/ou de missão crítica. Para essas operações, recomendamos que você configure a resiliência máxima. Este projeto arquitetônico é recomendado como parte do Well Architected Framework sob o pilar de confiabilidade. A equipe de engenharia da Rota Expressa desenvolveu uma experiência de portal guiada para ajudá-lo a configurar a máxima resiliência.
Alta resiliência
Alta resiliência, também conhecida como ExpressRoute Metro, permite o uso de vários sites dentro da mesma área metropolitana (Metro) para conectar sua rede local por meio da Rota Expressa ao Azure. A alta resiliência oferece diversidade de locais, dividindo um único circuito em dois locais. A primeira ligação é estabelecida num local e a segunda num local diferente. O objetivo do ExpressRoute Metro é mitigar o efeito do isolamento e das falhas nos locais de borda, introduzindo recursos para permitir a diversidade do local. A diversidade de locais é alcançada usando um único circuito em locais emparelhados dentro de uma cidade metropolitana, o que oferece resiliência a falhas entre borda e região. O ExpressRoute Metro oferece um nível mais alto de resiliência do site do que a resiliência padrão, mas não tanto quanto a resiliência máxima. A arquitetura do ExpressRoute Metro pode ser usada para cargas de trabalho de negócios e de missão crítica dentro de uma região. Para obter mais informações, consulte ExpressRoute Metro
Resiliência padrão
A resiliência padrão no ExpressRoute é um único circuito com duas conexões configuradas em um único local. A redundância interna (Active-Active) é configurada para facilitar o failover entre as duas conexões do circuito. Hoje, o ExpressRoute oferece duas conexões em um único local de emparelhamento. Se ocorrer uma falha neste site, os usuários poderão experimentar perda de conectividade com suas cargas de trabalho do Azure. Essa configuração também é conhecida como single-homed , pois representa usuários com um circuito ExpressRoute configurado com apenas um local de emparelhamento. Essa configuração é considerada a menos resiliente e não é recomendada para cargas de trabalho de negócios ou de missão crítica porque não fornece resiliência ao site.
Resiliência zonal para ExpressRoute
As regiões do Azure são parte integrante da sua estratégia de resiliência e design da Rota Expressa. Essas regiões são localizações geográficas de data centers que hospedam serviços do Azure. As regiões são interconectadas por meio de uma rede dedicada de baixa latência e são projetadas para serem altamente disponíveis, tolerantes a falhas e escaláveis.
O Azure oferece vários recursos para garantir a resiliência regional. Um desses recursos são as zonas de disponibilidade. As zonas de disponibilidade protegem aplicativos e dados contra falhas no data center, abrangendo vários locais físicos dentro de uma região. As regiões e as zonas de disponibilidade são fundamentais para o design do aplicativo e a estratégia de resiliência. Ao utilizar zonas de disponibilidade, você pode obter maior disponibilidade e resiliência em suas implantações. Para obter mais informações, consulte Regiões & zonas de disponibilidade.
Recomendamos implantar seus Gateways de Rede Virtual ExpressRoute como zona redundante em zonas de disponibilidade dentro de uma região. Essas zonas de disponibilidade são locais físicos separados com infraestrutura independente (energia, resfriamento e rede). O objetivo é proteger sua conectividade de rede local com o Azure contra falhas no nível da zona. Os gateways de Rota Expressa com redundância de zona fornecem resiliência, escalabilidade e maior disponibilidade para acessar serviços de missão crítica no Azure.
Falhas de equipamento ou desastres em data centers regionais e zonais podem afetar as implantações de gateway da Rota Expressa em redes virtuais. Se os gateways não forem implantados como redundantes de zona, essas falhas em um data center do Azure podem afetar a capacidade dos usuários de acessar suas cargas de trabalho do Azure.
Se você tiver gateways de Rota Expressa redundantes não zonados existentes, agora há a capacidade de migrar para um gateway habilitado para zona de disponibilidade.
Recomendações
Veja a seguir recomendações para garantir alta disponibilidade, resiliência e confiabilidade em sua arquitetura de rede ExpressRoute:
- Recomendações de circuitos de Rota Expressa
- Recomendações do ExpressRoute Gateway
- Recomendações de recuperação de desastres e alta disponibilidade
- Recomendações de monitorização e alerta
Recomendações de circuitos de Rota Expressa
Planejar o circuito ExpressRoute ou o ExpressRoute Direct
Durante a fase inicial de planejamento, é crucial determinar se é necessário configurar um circuito de Rota Expressa ou uma conexão de Rota Expressa Direta. Um circuito de Rota Expressa permite uma conexão dedicada privada no Azure com a assistência de um provedor de conectividade. O ExpressRoute Direct permite a extensão de uma rede local diretamente para a rede Microsoft em um local de emparelhamento. Também é necessário identificar o requisito de largura de banda e o requisito do tipo de circuito SKU para atender às suas necessidades de negócios.
Avalie a resiliência de circuitos redundantes de Rota Expressa em vários locais
Depois de implantar circuitos redundantes de Rota Expressa em vários locais com resiliência máxima, é essencial garantir que as rotas locais sejam anunciadas nos circuitos redundantes para utilizar plenamente os benefícios da redundância em vários locais. Para avaliar a resiliência e testar o failover de circuitos e rotas redundantes Saiba mais aqui.
Planejar a configuração ativo-ativo
Para melhorar a resiliência e a disponibilidade, a Microsoft recomenda operar ambas as conexões de um circuito de Rota Expressa no modo ativo-ativo. Ao permitir que duas conexões operem nesse modo, a Microsoft equilibra a carga do tráfego de rede entre as conexões por fluxo.
Diversidade da camada física
Para uma melhor resiliência, planeje estabelecer vários caminhos entre a borda local e os locais de emparelhamento (locais de presença do provedor/Microsoft). Essa configuração pode ser obtida utilizando diferentes provedores de serviços ou roteando através de outro local de emparelhamento da rede local. Para alta disponibilidade, é essencial manter a redundância do circuito ExpressRoute em toda a arquitetura de rede de ponta a ponta. Isso inclui manter a redundância em sua rede local e redundância em seu provedor de serviços. Garantir redundância nessas partes da sua arquitetura significa que você não deve ter um único ponto de falha.
Verifique se o BFD (Bidirectional Forwarding Detection) está habilitado e configurado
A ativação da Deteção de Encaminhamento Bidirecional (BFD) sobre a Rota Expressa pode acelerar a deteção de falha de link entre os dispositivos MSEE e os roteadores nos quais o circuito da Rota Expressa está configurado. A Microsoft recomenda configurar os dispositivos CPE (Customer Premises Edge) com BFD. O ExpressRoute pode ser configurado em seus dispositivos de roteamento de borda ou em seus dispositivos de roteamento de Borda de Parceiro. O BFD está habilitado por padrão nos dispositivos MSEE do lado da Microsoft.
Recomendações do ExpressRoute Gateway
Planejar o Gateway de Rede Virtual
Crie Gateways de Rede Virtual com redundância de zona para maior resiliência e planeje Gateways de Rede Virtual em diferentes regiões para recuperação de desastres e alta disponibilidade. Ao utilizar gateways com redundância de zona, você pode se beneficiar da resiliência de zona para acessar seus serviços de missão crítica e escaláveis no Azure.
Migrar para gateways de Rota Expressa com redundância de zona
A experiência de migração guiada de gateway facilita a migração de um SKU não habilitado para Az para um gateway SKU habilitado para Az. Esse recurso permite a criação de um gateway de rede virtual adicional dentro da mesma sub-rede de gateway. Durante o processo de migração, o Azure transfere o plano de controle e as configurações de caminho de dados do gateway existente para o novo.
Recomendações de recuperação de desastres e alta disponibilidade
Habilite a alta disponibilidade e a recuperação de desastres
Para maximizar a disponibilidade, os segmentos de clientes e provedores de serviços em seu circuito de Rota Expressa devem ser projetados para disponibilidade e resiliência. Para a recuperação de desastres, planeje cenários como interrupções de serviços regionais devido a calamidades naturais. Implemente um projeto robusto de recuperação de desastres para vários circuitos configurados através de diferentes locais de emparelhamento em diferentes regiões. Para saber mais, consulte: Projetando para recuperação de desastres.
Planejar redundância geográfica
Para o planejamento da recuperação de desastres, recomendamos a configuração de circuitos de Rota Expressa em vários locais e regiões de emparelhamento. Os circuitos ExpressRoute podem ser criados na mesma área metropolitana ou em diferentes áreas metropolitanas, e diferentes provedores de serviços podem ser usados para diversos caminhos através de cada circuito. Os circuitos ExpressRoute com redundância geográfica são utilizados para criar uma conectividade de rede de back-end robusta para recuperação de desastres. Para saber mais, consulte Projetando para alta disponibilidade.
Nota
O uso de VPN site a site como uma solução de backup para conectividade de Rota Expressa não é recomendado ao lidar com cargas de trabalho sensíveis à latência, de missão crítica ou que consomem muita largura de banda. Nesses casos, é aconselhável projetar para recuperação de desastres com a resiliência multissite do ExpressRoute para garantir a máxima disponibilidade.
Emparelhamento de rede virtual para conectividade entre redes virtuais
O Emparelhamento de Rede Virtual (VNet) fornece um método mais eficiente e direto, permitindo que os serviços do Azure se comuniquem entre redes virtuais sem a necessidade de um gateway de rede virtual, saltos extras ou trânsito pela Internet pública. Para estabelecer conectividade entre redes virtuais, o emparelhamento de rede virtual deve ser implementado para o melhor desempenho possível. Para obter mais informações, consulte Sobre emparelhamento de rede virtual e Gerenciar emparelhamento de VNet.
Recomendações de monitorização e alerta
Configurar monitoramento e alertas para circuitos de Rota Expressa
Como linha de base, recomendamos configurar o Network Insights no Azure Monitor para exibir todas as métricas de circuito da Rota Expressa, incluindo o ExpressRoute Direct e o Alcance Global. Dentro da placa de circuitos, você pode visualizar topologias e dependências para emparelhamentos, conexões e gateways. Os insights disponíveis para circuitos incluem disponibilidade, taxa de transferência e quedas de pacotes.
Configurar alertas de integridade do serviço para notificações de manutenção de circuito de Rota Expressa
A Rota Expressa usa a Integridade do Serviço do Azure para notificá-lo sobre a manutenção planejada e futura do circuito da Rota Expressa. Com o Estado de Funcionamento do Serviço, pode ver a manutenção planeada e passada no portal do Azure, juntamente com a configuração de alertas e notificações que melhor se adequam às suas necessidades. Em Estado de Funcionamento do Serviço, pode ver Manutenção planeada ou Anterior. Você também pode definir alertas dentro da Integridade do Serviço para ser notificado sobre a próxima manutenção.
Configurar monitor de conexão para Rota Expressa
O Monitor de Conexão é uma solução de monitoramento de rede baseada em nuvem que monitora a conectividade entre implantações de nuvem do Azure e locais locais (filiais, etc.). O Monitor de Conexão é uma solução baseada em agente.
Configurar monitoramento de integridade do gateway e alertas
Configure o monitoramento usando o Azure Monitor para disponibilidade, desempenho e escalabilidade do Gateway de Rota Expressa. Quando você implanta um gateway de Rota Expressa, o Azure gerencia a computação e as funções do seu gateway. Há várias métricas de gateway disponíveis para você entender melhor o desempenho do seu gateway.