Compartilhar via


Diretrizes de manutenção planejada do ExpressRoute

Os circuitos do ExpressRoute e as portas diretas são configurados com uma conexão primária e secundária com dispositivos MSEE (Microsoft Enterprise Edge) em locais de emparelhamento da Microsoft. Essas conexões são estabelecidas em dispositivos fisicamente diferentes para oferecer conectividade confiável do local para os recursos do Azure se houver eventos planejados ou não planejados.

Este artigo explica o que acontece durante uma manutenção de circuito do ExpressRoute e fornece ações que devem ser tomadas para minimizar a interrupção do serviço afetada por uma manutenção planejada ou não planejada.

Preparar-se para manutenção

Os dispositivos MSEE passam por manutenção para melhorar a confiabilidade da plataforma, aplicar patches de segurança, substituir hardware com falha etc. As operações de manutenção são necessárias nos roteadores MSEE (Microsoft Enterprise Edge) para melhorar os serviços de circuito do ExpressRoute ou aplicar uma nova versão de software. A atividade de manutenção é planejada e agendada com antecedência para minimizar o efeito em seus serviços.

Resiliência do circuito do ExpressRoute

A resiliência de um circuito do ExpressRoute é obtida com duas conexões com dois MSEEs em um local do ExpressRoute.

A Microsoft requer sessões BGP duplas do provedor de conectividade ou da borda de sua rede, uma para cada MSEE. Para estar em conformidade com o SLA (contrato de nível de serviço) associado ao circuito do ExpressRoute, as sessões BGP duplas entre os roteadores MSEE e seus roteadores de borda devem ser estabelecidas simultaneamente.

Diagrama de uma conexão típica do circuito do ExpressRoute no local.

Ativar alertas de manutenção

Quando uma manutenção planejada é agendada, você é notificado pelo menos 14 dias antes da janela de trabalho por meio das notificações da Integridade do Serviço do Azure. Com a Integridade do Serviço, você pode configurar alertas para manutenção do Circuito do ExpressRoute, exibir a manutenção planejada e agendada. Para saber mais sobre a Integridade do Serviço para manutenção do ExpressRoute, confira exibir e configurar alertas de manutenção do ExpressRoute. É crucial que você assine a Integridade do Serviço do Azure para ser informado com antecedência sobre os eventos de manutenção.

Como os eventos de manutenção são agendados

A manutenção planejada no MSEE está agendada para ocorrer em duas janelas de tempo diferentes. Essa separação é para garantir que a conectividade em seus circuitos do ExpressRoute não seja interrompida devido ao evento de manutenção e que pelo menos um caminho esteja sempre disponível para acessar seus serviços do Azure.

Durante a manutenção, habilitamos o prefixo de caminho AS, que permite que o tráfego seja drenado para o caminho redundante normalmente. O prefixo de caminho AS é feito anexando AS 12076 (oito vezes) às rotas BGP em direção ao local e à conexão de gateway do ExpressRoute. Você precisa garantir que todos os dispositivos locais no caminho estejam configurados para aceitar o prefixo de caminho AS e permitir que o tráfego do local se mova para o caminho redundante do ExpressRoute.

Verifique com seu provedor de serviços para confirmar se ele está configurado para permitir o prefixo de caminho AS em suas conexões, caso esteja gerenciando sua rede.

Atividade de manutenção entre roteadores MSEE e rede principal da Microsoft

Durante a atividade de manutenção, a sessão BGP entre a sua rede local e o MSEE pode estar em um estado estabelecido e anunciando rotas da sua rede local para os roteadores do MSEE. Nesse caso, não é possível confiar apenas na presença de uma sessão BGP estabelecida no roteador de borda para determinar a integridade da conexão. Sua política de roteamento pode forçar o tráfego a ser enviado para uma conexão específica de qualquer maneira. Essa configuração pode causar descarte de tráfego à medida que o tráfego é roteado para a conexão que está passando por manutenção e o tráfego de retorno está sobre o caminho redundante. Para evitar que o descarte de tráfego aconteça, a configuração em seus roteadores de borda deve ser configurada para encaminhar o tráfego quando a conexão receber anúncios BGP do AS 12076 e com o tráfego encaminhando para a conexão com a melhor métrica BGP. Quando a métrica BGP na conexão primária e secundária é idêntica, o tráfego fica com balanceamento de carga.

Diagrama de onde a conectividade é perdida durante uma manutenção planejada no circuito do ExpressRoute.

Validação do failover do circuito do ExpressRoute

Depois de concluir a ativação de um circuito do ExpressRoute e antes de ser usado na produção, a prática recomendada é executar um teste de failover para verificar se as configurações do BGP do roteador de borda do cliente estão corretas.

O processo de validação do failover do circuito do ExpressRoute pode ser executado em duas etapas:

  1. Desligue a sessão BGP entre o roteador de borda local e a conexão primária no roteador MSEE. Isso força o tráfego somente por meio da conexão secundária. Você pode monitorar as estatísticas de tráfego na conexão MSEE usando o comando Get-AzExpressRouteCircuitStats. As métricas de tráfego BitsInPerSecond e BitsOutPerSecond só devem incrementar no caminho que está ativo no momento.

    Diagrama do BGP de emparelhamento para conexão primária de um circuito do ExpressRoute.

    Quando o teste for concluído com êxito, vá para a segunda etapa.

  2. Desligue a sessão BGP entre o roteador de borda local e a conexão MSEE secundária. Repita as ações de verificação na Etapa 1 para validar se o tráfego só está incrementando no caminho primário.

    Diagrama do BGP de emparelhamento para conexão secundária de um circuito do ExpressRoute.

Você pode executar mais testes introduzindo o prefixo de caminho AS em cada caminho do seu local em direção ao MSEE para verificar o failover do fluxo de tráfego. Um teste semelhante pode ser executado com o seu provedor de serviços para introduzir o prefixo de caminho AS em direção à rede local a partir da borda do provedor. O procedimento de failover descrito deve ser verificado para o emparelhamento privado do ExpressRoute e o emparelhamento da Microsoft do ExpressRoute.

Para verificar o status de sessões BGP no teste de failover, você pode usar as diretrizes descritas na documentação Verificar conectividade do ExpressRoute.

A validação de failover de um circuito do ExpressRoute reduz o risco de interrupções durante a manutenção planejada dos circuitos do ExpressRoute.

Se a verificação do failover do circuito do ExpressRoute não tiver sido concluída e o circuito do ExpressRoute já estiver em produção, nunca é tarde demais para agendar uma manutenção do cliente, fora do horário comercial e prosseguir com o teste de failover.

Observação

Como diretriz geral, o encerramento de conexões BGP do ExpressRoute em dispositivos com estado (como firewalls) pode causar problemas com failover durante as manutenções planejadas ou não planejadas pela Microsoft ou pelo seu provedor do ExpressRoute. Você deve avaliar a configuração para garantir que o tráfego fará o failover corretamente e, quando possível, encerrar as sessões BGP em dispositivos sem estado.

Monitor do circuito do ExpressRoute

Você deve acompanhar o status de conexões por meio de circuitos do ExpressRoute. Controlar a integridade da conectividade de rede é importante para reagir a status não íntegros e tomar medidas corretivas imediatas. Os alertas do Azure Monitor notificam você de forma proativa quando condições que causam efeitos negativos são encontradas nos dados de monitoramento.

Revise as métricas disponíveis para monitoramento do ExpressRoute para o circuito do ExpressRoute e as portas diretas. No mínimo, você deve configurar alertas para disparar para disponibilidade de ARP, disponibilidade BGP e protocolo de linha. Em seguida, configure notificações por email a serem enviadas quando ocorrer uma interrupção do serviço.

Você pode elevar as informações do monitor usando Monitor da Conexão para o ExpressRoute. O Monitor da Conexão é uma solução de monitoramento de rede baseada em nuvem que monitora a conectividade entre redes locais (filiais etc.) e implantações de nuvem do Azure. Esse serviço é usado para rastrear não apenas interrupções de serviço, mas também degradação de desempenho de ponta a ponta para seus serviços.

Próximas etapas