Efetuar a ativação pós-falha e reativação pós-falha com o Azure Site Recovery

Concluído

O Azure Site Recovery permite que sua organização tenha flexibilidade, fazendo failover manual para uma região secundária do Azure ou fazendo failover de volta para uma VM de origem. A forma mais simples de gerir este processo é manualmente no portal do Azure. Tem outras opções para ativar a automatização se a sua empresa quiser automatizar o acionamento de uma ativação pós-falha. Essas opções incluem tecnologias como scripts via PowerShell ou configuração de runbooks na Automação do Azure para orquestrar failovers.

Siga estes passos para executar uma ativação pós-falha completa da VM protegida numa região secundária na sua subscrição. Após a ativação pós-falha ter sido concluída com êxito, poderá efetuar a reativação pós-falha dessa VM.

Nesta unidade, iremos explorar a ativação pós-falha e reativação pós-falha, como proteger novamente uma VM em que efetuou a ativação pós-falha e monitorizar o estado da nova proteção.

O que é a ativação pós-falha?

Diagrama mostrando uma região de origem indisponível e um novo ambiente de destino para o qual está sendo submetido failover.

Uma ativação pós-falha ocorre quando é tomada a decisão de executar um plano de DR para a configuração. O ambiente de produção existente, protegido pelo Site Recovery, é replicado para uma região diferente. O ambiente de destino torna-se o ambiente de produção de fato e torna-se o ambiente no qual os serviços de produção da sua organização são executados. Depois de a região de destino ser ativada, o ambiente de origem não deve continuar a ser utilizado. Aplicará esta condição ao deixar as VMs de origem paradas.

Existe outra vantagem em encerrar as VMs de origem. Utilizar uma VM encerrada resulta numa perda mínima de dados, pois o Site Recovery aguarda que todos os dados sejam escritos no disco antes de acionar a ativação pós-falha. Para utilizar estes dados e ter o RPO mais baixo possível, selecionamos o ponto de recuperação Mais Recente (RPO mais baixo).

Captura de tela mostrando as opções de failover.

Em que consiste uma nova proteção e por que motivo é importante?

Quando é feito failover de uma VM, a replicação executada pelo Site Recovery não está mais ativa. Tem de reativar a proteção para começar a proteger a VM em que foi efetuada a ativação pós-falha. Como você já tem a infraestrutura em uma região diferente, pode iniciar a replicação de volta para a região de origem. A nova proteção permite que o Site Recovery comece a replicar o novo ambiente de destino para o ambiente de origem onde começou.

Você pode usar a flexibilidade de failover de VMs únicas ou failover usando um plano de recuperação para reproteger sua infraestrutura de failover. Pode proteger novamente cada VM individualmente ou pode proteger novamente múltiplas VMs com um plano de recuperação.

A nova proteção demora entre 45 minutos a 2 horas, dependendo do tamanho e tipo de VM. Ao contrário dos outros processos de Recuperação de Site que você pode monitorar observando o progresso do trabalho, você deve exibir o progresso da reproteção no nível da VM. Este requisito é porque a fase de sincronização não está listada como uma tarefa de recuperação de sites.

Esta imagem mostra o estado do item protegido, com a percentagem sincronizada realçada.

Captura de tela mostrando o status da VM de registros do paciente, com a porcentagem sincronizada realçada.

O que é a reativação pós-falha?

Uma reativação pós-falha é o processo inverso de uma ativação pós-falha. É onde uma ativação pós-falha concluída para uma região secundária foi consolidada e agora é o ambiente de produção. A nova proteção foi concluída para o ambiente em que foi efetuada a ativação pós-falha e o ambiente de origem é agora a réplica. Num cenário de reativação pós-falha, o Site Recovery irá efetuar a ativação pós-falha das VMs de origem.

O processo para concluir uma reativação pós-falha é igual ao processo da ativação pós-falha, até mesmo na reutilização do plano de recuperação. A ativação pós-falha no seu plano de recuperação tem a opção De definida como a região de destino e a opção Para definida como a região de origem.

Gerir ativações pós-falha

O Site Recovery pode executar ativações pós-falha a pedido. As ativações pós-falha de teste são isoladas, o que significa que não afetam os serviços de produção. Essa flexibilidade permite executar um failover sem interromper os usuários do sistema. A flexibilidade funciona também da outra forma, que permite a reativação pós-falha a pedido como parte de um teste previsto ou como parte de um processo de recuperação após desastre totalmente invocado.

Os planos de recuperação no Site Recovery também permitem a personalização e sequenciação da ativação pós-falha e reativação pós-falha. Os planos permitem agrupar máquinas e cargas de trabalho.

A flexibilidade também pode ser aplicada ao modo como aciona o processo de ativação pós-falha. As ativações pós-falha manuais são fáceis de efetuar através do portal do Azure. O scripting do PowerShell ou a utilização de runbooks na Automatização do Azure também disponibilizam opções de automatização.

Corrigir problemas com uma ativação pós-falha

Embora o Site Recovery seja automatizado, ainda podem ocorrer erros. A seguinte lista apresenta os três problemas mais comuns observados. Para obter uma lista completa de problemas e como resolvê-los, veja a ligação na unidade Resumo.

Problemas de quota de recursos do Azure

O Site Recovery tem de criar recursos em diferentes regiões. Se a nossa subscrição não conseguir fazer isso, a replicação falha. Este erro também ocorre se a nossa subscrição não tiver os limites de quota corretos para criar VMs que correspondam ao tamanho das VMs de origem.

Você pode corrigir isso entrando em contato com o suporte de cobrança do Azure e solicitando que eles criem as VMs de tamanho correto na região de destino necessária.

Um ou mais discos estão disponíveis para proteção

Este erro ocorre se tiver concluído a configuração do Site Recovery para as suas VMs. Posteriormente, adicionou ou inicializou discos extra.

Para corrigir este erro, pode adicionar replicação para os discos adicionados recentemente ou pode optar por ignorar o aviso do disco.

Certificados de raiz fidedignos

Verifique se os certificados de raiz mais recentes estão instalados para permitir que o Site Recovery comunique e autentique VMs para replicação com segurança. Pode ver este erro se as suas VMs não tiverem as atualizações mais recentes aplicadas. Antes que o Site Recovery possa ativar a replicação, tem de atualizar as VMs do Windows e Linux.

A correção é diferente para cada sistema operativo. O Windows é tão simples quanto garantir que a atualização automática do Windows seja ativada e que as atualizações sejam aplicadas. Para cada distribuição do Linux, terá de seguir a orientação fornecida pelo distribuidor.