Executar um teste de recuperação após desastre

Concluído

Os testes de recuperação após desastre permitem-lhe fazer um teste à capacidade que a sua empresa tem de recuperar de um desastre sem afetar os serviços de produção.

Depois de produzir um plano de continuidade de negócios e recuperação de desastres (BCDR), você será solicitado a explorar as opções de como o sistema pode ser testado sem interromper o serviço ao vivo. Você deseja saber mais sobre exercícios de recuperação e como eles podem verificar se sua solução do Azure Site Recovery está configurada e funciona corretamente.

Nesta unidade, você obtém uma compreensão do tempo de recuperação e dos objetivos do ponto de recuperação. Em seguida, você pode ver como usar um drill de recuperação para testar se o Site Recovery foi configurado corretamente para atender a esses objetivos.

Teste de recuperação após desastre

Com o Site Recovery, você pode fazer um teste completo de recuperação de desastres sem afetar seu ambiente ativo existente. Os planos de recuperação são criados no Site Recovery para permitir a automação de tarefas de recuperação e modelar um aplicativo em torno de suas dependências. Por exemplo, como a necessidade de o Ative Directory ou o DNS funcionarem. Os planos BCDR também permitem que você teste sua recuperação de desastres.

Depois que um plano BCDR é criado no portal do Azure, ele pode ser executado para fins de teste. Siga estes passos:

  1. Na seção Recuperação de Site do portal do Azure, selecione Planos de Recuperação> com o nome >do plano de recuperação Failover de teste.

  2. Selecione o ponto de recuperação nas opções apresentadas. As opções incluem Processado mais recentemente, que é o mais recente ponto de recuperação processado pelo Site Recovery.

  3. Selecione a rede virtual do Azure na qual a máquina virtual deve ser criada. Utilize uma rede isolada do ambiente ativo para evitar afetar os ambientes de produção.

  4. Acompanhe o progresso no separador Tarefas e no dashboard do Site Recovery.

Monitorizar uma recuperação de teste

Utilize o dashboard do Site Recovery para monitorizar operações de recuperação, que incluem testes de recuperação após desastre iniciados em circunstâncias de teste. O painel é acessado de dentro do cofre dos Serviços de Recuperação selecionando Visão geral. Em seguida, são apresentados os separadores para monitorizar as operações do Site Recovery e de cópia de segurança.

No dashboard, pode monitorizar os itens replicados e as ativações pós-falha de teste. É atribuído um estado específico a cada item replicado em ambas as categorias para uma comparação fácil de um item em bom estado de funcionamento com um item que tem problemas. Veja a imagem a seguir.

Site Recovery overview.

(1) Backup ou Recuperação de Site: alterne entre os painéis Backup ou Site Recovery . Neste exemplo, está no separador Site Recovery.

(2) Itens - replicados Íntegros: A replicação está sendo executada normalmente sem avisos. A mensagem Aviso significa que foram identificados um ou mais problemas que podem afetar a replicação. O estado Crítico significa que foram identificados um ou mais erros de replicação críticos.

(3) Teste de failover bem-sucedido - Teste recomendado: máquinas específicas não tiveram um failover desde que a proteção do Site Recovery foi ativada. Executado com êxito significa que foram replicadas com êxito uma ou mais máquinas. A mensagem Não aplicável significa que as máquinas não são atualmente elegíveis para uma ativação pós-falha de teste.

(4) Problemas de configuração Configurações ausentes: Falta uma configuração - necessária. A mensagem Recursos em falta significa que não foi possível encontrar ou não está disponível um recurso especificado. Um exemplo é um recurso eliminado, como uma rede virtual. A Quota da subscrição mostra a quantidade de recursos disponíveis para a sua subscrição e se existem recursos suficientes para efetuar uma ativação pós-falha. As Atualizações de software mostram a disponibilidade de novas atualizações de software e informações sobre o software desatualizado.

(5) Resumo do erro: analise um resumo dos erros aqui para facilitar o acesso, para que você possa identificar rapidamente quaisquer problemas em seu ambiente.

(6) Visualização da infraestrutura: veja uma visualização da sua infraestrutura de replicação e uma exibição da integridade.

(7) Planos de recuperação: veja os planos de recuperação para a sua infraestrutura.

(8) Trabalhos - Últimas 24 horas: Veja o status de todos os trabalhos que estão em andamento, aguardando ou que falharam.

Verifique o seu conhecimento

1.

Qual dessas opções melhor define um RTO (Recovery Time Objetive, objetivo de tempo de recuperação)?

2.

Quando monitoriza uma recuperação do cofre dos Serviços de Recuperação, quais das seguintes estatísticas pode consultar no dashboard do Site Recovery?