Sobre failover/failback de recuperação de desastres local - Modernizado
Este artigo fornece uma visão geral do failover e failback durante a recuperação de desastres de máquinas locais para o Azure com o Azure Site Recovery - Modernizado.
Para obter informações sobre failover e failback nas versões do Azure Site Recovery Classic, consulte este artigo.
Fases de recuperação
O failover e o failback na Recuperação de Site têm quatro estágios:
- Estágio 1: Failover local: Depois de configurar a replicação para o Azure para máquinas locais, quando seu site local fica inativo, você faz failover dessas máquinas para o Azure. Após o failover, as VMs do Azure são criadas a partir de dados replicados.
- Estágio 2: Reproteger as VMs do Azure: no Azure, você reprotege as VMs do Azure para que elas comecem a replicar de volta para o site local. A VM local (se disponível) é desativada durante a reproteção, para ajudar a garantir a consistência dos dados.
- Estágio 3: Failover do Azure: quando seu site local estiver sendo executado normalmente novamente, você executará outro failover, desta vez para fazer failback de VMs do Azure para seu site local. Você pode fazer failback para o local original do qual fez failover ou para um local alternativo. Essa atividade é chamada de failover planejado.
- Estágio 4: Reproteger máquinas locais: após failback, habilite novamente a replicação das máquinas locais para o Azure.
Ativação pós-falha
Você executa um failover como parte de sua estratégia de continuidade de negócios e recuperação de desastres (BCDR).
- Como um primeiro passo em sua estratégia BCDR, você replica suas máquinas locais para o Azure continuamente. Os usuários acessam cargas de trabalho e aplicativos em execução nas máquinas de origem locais.
- Se for necessário, por exemplo, se houver uma interrupção no local, você fará failover das máquinas replicadoras para o Azure. As VMs do Azure são criadas usando os dados replicados.
- Para continuidade de negócios, os usuários podem continuar acessando aplicativos nas VMs do Azure.
O failover é uma atividade bifásica:
- Failover: o failover que cria e traz uma VM do Azure usando o ponto de recuperação selecionado.
- Confirmar: Após o failover, você verifica a VM no Azure:
- Em seguida, você pode confirmar o failover para o ponto de recuperação selecionado ou selecionar um ponto diferente para a confirmação.
- Depois de confirmar o failover, o ponto de recuperação não pode ser alterado.
Nota
Use o ponto de recuperação consistente com falhas no Windows Server 2012 ou em versões mais antigas, pois o tempo de inicialização de VMs com failover pode ser maior para essas versões no caso de ponto de recuperação consistente do aplicativo.
Conectar-se ao Azure após failover
Para se conectar às VMs do Azure criadas após failover usando RDP/SSH, há vários requisitos.
Ativação pós-falha | Location | Ações |
---|---|---|
VM do Azure executando o Windows | Na máquina local antes do failover | Acesso pela internet: Ativar RDP. Verifique se as regras TCP e UDP foram adicionadas para Público e se o RDP é permitido para todos os perfis em Aplicativos Permitidos do Firewall>do Windows. Acesso por VPN site a site: habilite o RDP na máquina. Verifique se o RDP é permitido no Firewall do Windows -> Aplicativos e recursos permitidos, para redes privadas e de domínio. Verifique se a política de SAN do sistema operacional está definida como OnlineAll. Mais informações. Verifique se não há atualizações do Windows pendentes na VM quando você acionar um failover. O Windows Update pode ser iniciado quando você faz failover e você não poderá fazer logon na VM até que as atualizações sejam concluídas. |
VM do Azure executando o Windows | Na VM do Azure após failover | Adicione um endereço IP público para a VM. As regras do grupo de segurança de rede na VM com failover (e na sub-rede do Azure à qual ela está conectada) devem permitir conexões de entrada para a porta RDP. Verifique o diagnóstico de inicialização para verificar uma captura de tela da VM. Se você não conseguir se conectar, verifique se a VM está em execução e revise as dicas de solução de problemas. |
VM do Azure executando Linux | Na máquina local antes do failover | Verifique se o serviço Secure Shell na VM está definido para iniciar automaticamente na inicialização do sistema. Verifique se as regras de firewall permitem uma ligação SSH ao mesmo. |
VM do Azure executando Linux | Na VM do Azure após failover | As regras do grupo de segurança de rede na VM com failover (e na sub-rede do Azure à qual ela está conectada) precisam permitir conexões de entrada para a porta SSH. Adicione um endereço IP público para a VM. Verifique o diagnóstico de inicialização para obter uma captura de tela da VM. |
Tipos de failover
A Recuperação de Site fornece diferentes opções de failover.
Ativação pós-falha | Detalhes | Recuperação | Fluxo de Trabalho |
---|---|---|---|
Failover de teste | Usado para executar um drill que valida sua estratégia BCDR, sem qualquer perda de dados ou tempo de inatividade. | Cria uma cópia da VM no Azure, sem impacto na replicação contínua ou no seu ambiente de produção. | 1. Execute um failover de teste em uma única VM ou em várias VMs em um plano de recuperação. 2. Selecione um ponto de recuperação a ser usado para o failover de teste. 3. Selecione uma rede do Azure na qual a VM do Azure estará localizada quando for criada após o failover. A rede é usada apenas para o failover de teste. 4. Verifique se a broca funcionou conforme o esperado. O Site Recovery limpa automaticamente as VMs criadas no Azure durante a perfuração. |
Failover planejado-Hyper-V | Usado para tempo de inatividade planejado. As VMs de origem são desligadas. Os dados mais recentes são sincronizados antes de iniciar o failover. |
Zero perda de dados para o fluxo de trabalho planejado. | 1. Planeje uma janela de manutenção de tempo de inatividade e notifique os usuários. 2. Coloque os aplicativos voltados para o usuário offline. 3. Inicie um failover planejado com o ponto de recuperação mais recente. O failover não será executado se a máquina não for desligada ou se forem encontrados erros. 4. Após o failover, verifique se a réplica da VM do Azure está ativa no Azure. 5. Confirme o failover para terminar. A ação de confirmação exclui todos os pontos de recuperação. |
Failover-Hyper-V | Geralmente é executado se houver uma interrupção não planejada ou se o site principal não estiver disponível. Opcionalmente, desligue a VM e sincronize as alterações finais antes de iniciar o failover. |
Perda mínima de dados para aplicações. | 1. Inicie o seu plano BCDR. 2. Inicie um failover. Especifique se o Site Recovery deve desligar a VM e sincronizar/replicar as alterações mais recentes antes de acionar o failover. 3. Você pode fazer failover para muitas opções de ponto de recuperação, resumidas aqui. Se você não habilitar a opção para desligar a VM ou se a Recuperação de Site não puder desligá-la, o ponto de recuperação mais recente será usado. O failover é executado mesmo se a máquina não puder ser desligada. 4. Após o failover, verifique se a réplica da VM do Azure está ativa no Azure. Se necessário, você pode selecionar um ponto de recuperação diferente na janela de retenção de 24 horas. 5. Confirme o failover para terminar. A ação de confirmação exclui todos os pontos de recuperação disponíveis. |
Failover-VMware | Geralmente é executado se houver uma interrupção não planejada ou se o site principal não estiver disponível. Opcionalmente, especifique que a Recuperação de Site deve tentar disparar um desligamento da VM e sincronizar e replicar as alterações finais antes de iniciar o failover. |
Perda mínima de dados para aplicações. | 1. Inicie o seu plano BCDR. 2. Inicie um failover a partir da Recuperação de Site. Especifique se o Site Recovery deve tentar acionar o desligamento e a sincronização da VM antes de executar o failover. O failover é executado mesmo se as máquinas não puderem ser desligadas. 3. Após o failover, verifique se a réplica da VM do Azure está ativa no Azure. Se necessário, você pode selecionar um ponto de recuperação diferente na janela de retenção de 72 horas. 5. Confirme o failover para terminar. A ação de confirmação exclui todos os pontos de recuperação. Para VMs do Windows, o Site Recovery desativa as ferramentas VMware durante o failover. |
Failover planejado - VMware | Você pode executar um failover planejado do Azure para o local. | Como é uma atividade de failover planejada, o ponto de recuperação é gerado depois que o trabalho de failover planejado é acionado. | Quando o failover planejado é acionado, as alterações pendentes são copiadas para o local, um ponto de recuperação mais recente da VM é gerado e a VM do Azure é encerrada. Siga o processo de failover conforme discutido aqui. Postar isso, a máquina local está ligada. Após um failover planejado bem-sucedido, a máquina estará ativa em seu ambiente local. |
Processamento de failover
Em alguns cenários, o failover requer processamento adicional que leva cerca de 8 a 10 minutos para ser concluído. Você pode notar tempos de failover de teste mais longos para:
- VMs VMware que não têm o serviço DHCP habilitado.
- VMs VMware que não têm os seguintes drivers de inicialização: storvsc, vmbus, storflt, intelide, atapi.
Opções de ponto de recuperação
Durante o failover, você pode selecionar muitas opções de ponto de recuperação.
Opção | Detalhes |
---|---|
Último (RPO mais baixo) | Esta opção fornece o RPO (Recovery Point Objetive, objetivo de ponto de recuperação) mais baixo. Primeiro, ele processa todos os dados que foram enviados para o serviço de Recuperação de Site, para criar um ponto de recuperação para cada VM, antes de fazer failover para ele. Inicialmente, ele tenta processar e aplicar todos os dados enviados ao serviço de Recuperação de Site no local de destino e criar um ponto de recuperação usando os dados processados. No entanto, se no momento em que o failover foi acionado, não houver dados carregados no serviço de Recuperação de Site aguardando para serem processados, o Azure Site Recovery não executará nenhum processamento e, portanto, não criará um novo ponto de recuperação. Nesse cenário, ele fará failover usando apenas o ponto de recuperação processado anteriormente. |
Últimos tratados | Essa opção faz failover de VMs para o ponto de recuperação mais recente processado pelo Site Recovery. Para ver o ponto de recuperação mais recente para uma VM específica, verifique Pontos de recuperação mais recentes nas configurações da VM. Esta opção proporciona um RTO (Objetivo de Tempo de Recuperação) baixo, porque não é despendido tempo ao processar os dados não processados. |
Últimas aplicações consistentes | Essa opção faz failover de VMs para o ponto de recuperação consistente com o aplicativo mais recente processado pela Recuperação de Site se os pontos de recuperação consistentes com o aplicativo estiverem habilitados. Verifique o ponto de recuperação mais recente nas configurações da VM. |
Multi-VM mais recente processada | Essa opção está disponível para planos de recuperação com uma ou mais VMs que tenham a consistência de várias VMs habilitada. VMs com a configuração habilitada para failover para o ponto de recuperação consistente multi-VM comum mais recente. Quaisquer outras VMs no plano de failover para o ponto de recuperação processado mais recente. |
Últimas aplicações multi-VM consistentes | Essa opção está disponível para planos de recuperação com uma ou mais VMs que tenham a consistência de várias VMs habilitada. VMs que fazem parte de um failover de grupo de replicação para o mais recente ponto de recuperação comum consistente com vários aplicativos de VM. Outras VMs fazem failover para seu ponto de recuperação consistente com o aplicativo mais recente. |
Personalizadas | Use essa opção para fazer failover de uma VM específica para um determinado ponto no tempo de recuperação. Esta opção não está disponível para planos de recuperação. |
Nota
Os pontos de recuperação não podem ser migrados para outro cofre dos Serviços de Recuperação.
Reproteção/failover planejado
Após o failover para o Azure, as VMs replicadas do Azure ficam em um estado desprotegido.
- Como uma primeira etapa para retornar ao seu site local, você precisa iniciar as VMs do Azure replicando para o local. O processo de reproteção depende do tipo de máquinas que você fez failover.
- Depois que as máquinas estiverem replicando do Azure para o local, você poderá executar um failover do Azure para seu site local.
- Depois que as máquinas forem executadas no local novamente, você poderá habilitar a replicação para que elas sejam replicadas no Azure para recuperação de desastres.
- Somente os discos replicados do local para o Azure são replicados de volta do Azure durante a operação de reproteção. Os discos recém-adicionados à VM do Azure com failover não serão replicados para a máquina local.
- Um aparelho pode ter até 60 discos conectados a ele. Se as VMs que estão sendo failback tiverem mais de um total coletivo de 60 discos, ou se você estiver fazendo failback de grandes volumes de tráfego, crie um dispositivo separado para failback.
O failover planejado funciona da seguinte maneira:
- Para fazer failback no local, uma VM precisa de pelo menos um ponto de recuperação para fazer failback. Em um plano de recuperação, todas as VMs no plano precisam de pelo menos um ponto de recuperação.
- Como essa é uma atividade de failover planejada, você tem permissão para selecionar o tipo de ponto de recuperação para o qual deseja fazer failback. Recomendamos que você use um ponto consistente com falhas.
- Há também uma opção de ponto de recuperação consistente com o aplicativo. Nesse caso, uma única VM se recupera para seu ponto de recuperação consistente com o aplicativo mais recente disponível. Para um plano de recuperação com um grupo de replicação, cada grupo de replicação recupera para seu ponto de recuperação comum disponível.
- Os pontos de recuperação consistentes com aplicativos podem estar atrasados no tempo e pode haver perda de dados.
- Durante o failover do Azure para o site local, o Site Recovery desliga as VMs do Azure. Quando você confirma o failover, o Site Recovery remove as VMs do Azure com falha no Azure.
Nota
A inicialização da VM de failover pode levar mais tempo no Windows Server 2012 ou em versões mais antigas ao usar pontos de recuperação consistentes com falhas.
VMware/nova proteção física/reativação pós-falha
Para reproteger e fazer failback de máquinas VMware e servidores físicos do Azure para o local, certifique-se de ter um dispositivo saudável.
Seleção de aparelhos
- Você pode selecionar qualquer um dos dispositivos de replicação do Azure Site Recovery registrados em um cofre para reproteger localmente. Você não precisa de um servidor Process separado no Azure para a operação de reproteção e um servidor Master Target de expansão para VMs Linux.
- O dispositivo de replicação não requer outra conexão/portas de rede (em comparação com a proteção de encaminhamento) durante o failback. O mesmo aparelho pode ser usado para proteções para frente e para trás se estiver em bom estado. Isso não deve afetar o desempenho das replicações.
- Ao selecionar o dispositivo, certifique-se de que o armazenamento de dados de destino onde a máquina de origem está localizada esteja acessível pelo dispositivo. O armazenamento de dados da máquina de origem deve estar sempre acessível pelo aparelho. Mesmo que a máquina e o dispositivo estejam localizados em servidores ESX diferentes, desde que o armazenamento de dados seja compartilhado entre eles, a reproteção será bem-sucedida.
Nota
- Não há suporte para o armazenamento vMotion de itens replicados. O Storage vMotion do dispositivo de replicação não é suportado após a operação de reproteção.
- Ao selecionar o dispositivo, certifique-se de que o armazenamento de dados de destino onde a máquina de origem está localizada esteja acessível pelo dispositivo.
Reproteger o emprego
- Se esta for uma nova operação de reproteção, então, por padrão, uma nova conta de armazenamento de log será criada automaticamente pelo Azure Site Recovery na região de destino. O disco de retenção não é necessário.
- Em Recuperação de Local Alternativo e Recuperação de Local Original, as configurações originais das máquinas de origem são recuperadas.
Nota
- O endereço IP estático não pode ser mantido em caso de reproteção de local alternativo (ALR) ou reproteção de local original (OLR).
- fstab, LVMconf seria alterado.
Falha
- Qualquer trabalho de reproteção com falha pode ser repetido. Durante a nova tentativa, você pode escolher qualquer dispositivo de replicação íntegro.
Quando você reprotege as máquinas do Azure para o local, é notificado de que está retornando ao local original ou a um local alternativo.
Recuperação de local original: falha do Azure para a mesma máquina local de origem, se existir. Nesse cenário, somente as alterações são replicadas de volta para o local.
- Seleção do armazenamento de dados durante a OLR: o armazenamento de dados anexado à máquina de origem é selecionado automaticamente.
Recuperação de local alternativo: se a máquina local não existir, você poderá fazer failback do Azure para um local alternativo. Quando você reprotege a VM do Azure para o local, a máquina local é criada. A replicação completa de dados ocorre do Azure para o local. Analise os requisitos e limitações para failback de localização.
- Seleção do armazenamento de dados durante o ALR: qualquer armazenamento de dados gerenciado pelo vCenter no qual o dispositivo está situado e é acessível (permissões de leitura e gravação) pelo dispositivo pode ser escolhido (original/novo). Você pode escolher a conta de armazenamento em cache usada para reproteção.
Após a conclusão do failover, o agente de mobilidade na VM do Azure é registrado automaticamente nos Serviços de Recuperação de Site. Se o registro falhar, um problema crítico de integridade será gerado na VM com failover. Depois que o problema é resolvido, o registro é acionado automaticamente. Você pode concluir manualmente o registro depois de resolver os erros.
Cancelar failover
Se o seu ambiente local não estiver pronto ou se você enfrentar algum desafio, poderá cancelar o failover.
Depois de iniciar o failover planejado e ele ser concluído com êxito, seu ambiente local ficará disponível para uso. Mas após a conclusão da operação, se você quiser fazer failover para um ponto de recuperação diferente, poderá cancelar o failover.
Somente o failover planejado pode ser cancelado.
Você pode cancelar um failover planejado na página Itens replicados no cofre dos Serviços de Recuperação.
Depois que o failover é cancelado, suas máquinas no Azure são ativadas novamente e a replicação é iniciada novamente do Azure para o local.