Recuperação de desastre usando a ferramenta de Instantâneo Consistente do Aplicativo Azure

Artigo
06/01/2023

Este artigo explica como executar a recuperação de desastres ao usar a ferramenta de Instantâneo Consistente com o Aplicativo Azure que você pode usar com Azure NetApp Files.

Importante

Esta operação se aplica somente à Instância Grande do Azure.

Introdução

A plataforma de Instância Grande do Azure também pode ter um site de Recuperação de Desastre configurado no qual os instantâneos do volume de armazenamento podem ser replicados. Se os instantâneos tiverem sido configurados corretamente com essa configuração, será possível executar uma Recuperação de Desastre neste site. Este documento destina-se a ser um guia para executar a Recuperação de Desastres para essa configuração.

Pré-requisitos para a configuração da recuperação de desastre

Os pré-requisitos a seguir devem ser atendidos antes de você planejar o failover da recuperação de desastre.

Você tem um nó de DR (recuperação de desastres) provisionado no local de recuperação de desastre. Há duas opções para recuperação de desastre. Uma é a DR normal e a outra é a DR multipropósito.
A replicação de armazenamento está funcionando. A equipe de operações da Microsoft executa a configuração de replicação de armazenamento no momento do provisionamento de DR automaticamente. Você pode monitorar a replicação de armazenamento usando o comando azacsnap -c details --details replication no site de recuperação de desastre.
Você instalou e configurou instantâneos de armazenamento no local principal.
Você tem uma instância do HANA instalada no site de DR para o primário com o mesmo SID que a instância primária.
Você lê e entende o procedimento de Failover de DR descrito em Alta disponibilidade e recuperação de desastre de Instâncias Grandes do SAP HANA no Azure
Você instalou e configurou instantâneos de armazenamento no local da DR.
Um arquivo de configuração (por exemplo, DR.json) foi criado com os volumes de armazenamento de DR e as informações associadas no servidor de DR.
Você concluiu as etapas no site de recuperação de desastre para:
- Habilitar a comunicação com o armazenamento.
- Habilitar a comunicação com o SAP HANA.

Configurar recuperação de desastre

A Microsoft dá suporte à replicação do nível de armazenamento para recuperação de desastre. Há duas maneiras de configurar a DR.

Uma é a normal e a outra é a multipropósito. Na recuperação de desastre normal, você tem uma instância dedicada no local da recuperação de desastres para failover. No cenário de recuperação de desastre multipropósito, você tem outra instância de QA ou de desenvolvimento do HANA em execução na unidade de instância grande do HANA no local de recuperação de desastre. Mas você também instalou uma instância do HANA pré-instalada que está inativa e tem o mesmo SID que a instância do HANA que você deseja fazer failover para essa unidade de Instância Grande do HANA. A equipe de operações da Microsoft configura o ambiente para você, incluindo a replicação de armazenamento com base na entrada fornecida no SRF (Formulário de Solicitação de Serviço) no momento da integração.

Importante

Verifique se todos os pré-requisitos foram atendidos para a configuração de DR.

Monitorar a replicação de dados do site Primário para DR

A equipe de operações da Microsoft já gerencia e monitora o link de recuperação de desastre do site primário para o site de recuperação de desastre. Você pode monitorar a replicação de dados do servidor primário para o servidor de DR usando o comando de instantâneo azacsnap -c details --details replication.

Executar um failover para um site de DR

Execute o comando failover no site de DR (azacsnap -c restore --restore revertvolume).

Importante

O comando azacsnap -c restore --restore revertvolume interrompe a replicação de armazenamento do site de Produção para o site de DR. Você deve entrar em contato com a Microsoft Operations para configurar a replicação novamente. Depois que a replicação for habilitada novamente, todos os dados no armazenamento de DR para esse SID serão inicializados. O comando que executa o failover disponibiliza o instantâneo de armazenamento replicado mais recentemente. Se você precisar restaurar de volta para um instantâneo mais antigo, abra uma solicitação de suporte para que a equipe de operações possa ajudar a fornecer um instantâneo anterior restaurado no site de DR.

Em um alto nível, aqui estão as etapas a serem seguidas para o failover de DR:

Você deve desligar a instância do HANA no site primário. Essa ação é necessária apenas se você estiver realmente fazendo o failover para o site de DR para que você não tenha inconsistências de dados.
Desligue a instância do HANA no nó de DR para o SID de produção.
Executar o comando azacsnap -c restore --restore revertvolume no nó de DR com o SID a ser recuperado
- O comando interrompe o link de replicação de armazenamento do site Primário para o de DR
- O comando restaura apenas os volumes /data e /logbackups. O volume /shared NÃO é recuperado, mas, em vez disso, ele usa o /shared existente para o SID no local de DR.
- Montar o volume /data e /logbackups – certifique-se de adicioná-lo ao arquivo fstab
Restaure o instantâneo do HANA SYSTEMDB. O estúdio do HANA mostra apenas o instantâneo mais recente do HANA disponível no instantâneo de armazenamento restaurado como parte da execução do comando azacsnap -c restore --restore revertvolume.
Recupere o banco de dados do locatário.
Inicie a instância do HANA no site de DR para o SID de Produção (exemplo: H80 nesse caso).
Execute os testes.

Exemplo de execução de Recuperação de Desastres

Esta subseção descreve as etapas detalhadas para um failover para o site de Recuperação de Desastre.

Etapa 1: obter os detalhes de volume do nó de DR

Execute o comando df –h para listar os sistemas de arquivos e os volumes associados aos quais fazer referência após o failover.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Etapa 2: desligar o HANA no Site primário

Se estiver executando um failover completo de cargas de trabalho de produção e for possível se conectar ao site de produção primário, desligue as instâncias do SAP HANA que passarão por failover para DR.

Por exemplo, se estiver conectado como raiz, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <sid> pelo SID do SAP HANA.

su - <sid>adm
HDB stop

Etapa 3: desligar o HANA no site de DR

É importante desligar o SAP HANA no site de DR antes de restaurar os volumes.

Por exemplo, se estiver conectado como raiz, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <sid> pelo SID do SAP HANA.

su - <sid>adm
HDB stop

Importante

Verifique se as instâncias do HANA no site de DR estão offline antes de restaurar quaisquer volumes.

Etapa 4: restaurar os volumes

azacsnap -c restore --restore revertvolume --dbsid H80

Saída do comando de failover de DR.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80

* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Observação

As etapas no final da tela do console precisam ser executadas para concluir a preparação de armazenamento para um failover de DR.

Etapa 5: desmontar sistemas de arquivos desnecessários

Execute o comando umount para desmontar os sistemas de arquivos/volumes que não são necessários.

umount <Mount point>

Desmonte os pontos de montagem de dados e backup de log. Você pode ter vários pontos de montagem de dados no cenário de expansão.

Etapa 6: configurar os pontos de montagem

Modifique o arquivo /etc/fstab para comentar as entradas de backup de dados e de log para o SID primário (neste exemplo, SID=H80) e adicionar as novas entradas de ponto de montagem criadas a partir dos volumes de DR do site primário. As novas entradas de ponto de montagem são fornecidas na saída do comando.

Comente os pontos de montagem existentes em execução no site de DR com o caractere #:

#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
#172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Adicione as linhas a seguir a /etc/fstab

deve ser a mesma saída do comando

10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0

Etapa 7: montar os volumes de recuperação

Execute o comando mount –a para montar todos os pontos de montagem.

mount -a

Agora, se você executar df –h, deverá ver os volumes *_dp montados.

df -h

Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Etapa 8: recuperar o SYSTEMDB

No HANA Studio, clique com o botão direito do mouse em instância do SYSTEMDB e escolha "Backup e Recuperação" e, em seguida, "Recuperar Banco de Dados do Sistema"

Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o SYSTEMDB.

Etapa 9: recuperar o banco de dados do Locatário

No HANA Studio, clique com o botão direito do mouse em instância do SYSTEMDB e escolha "Backup e Recuperação" e, em seguida, "Recuperar Banco de Dados do Locatário".

Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o banco de dados do LOCATÁRIO.

Execute `azacsnap -c backup` no site de DR

Se você estiver executando backups baseados em instantâneo no site de DR, o Nome do Servidor do HANA configurado no arquivo de configuração azacsnap no site de DR deverá ser igual ao nome do servidor de produção.

Importante

A execução do azacsnap -c backup pode criar instantâneos de armazenamento no site de DR, eles não são replicados automaticamente para outro site. Trabalhe com o Microsoft Operations para entender melhor o retorno de quaisquer arquivos ou dados para o site de produção original.

Compartilhar via

Recuperação de desastre usando a ferramenta de Instantâneo Consistente do Aplicativo Azure

Introdução

Pré-requisitos para a configuração da recuperação de desastre

Configurar recuperação de desastre

Monitorar a replicação de dados do site Primário para DR

Executar um failover para um site de DR

Exemplo de execução de Recuperação de Desastres

Etapa 1: obter os detalhes de volume do nó de DR

Etapa 2: desligar o HANA no Site primário

Etapa 3: desligar o HANA no site de DR

Etapa 4: restaurar os volumes

Etapa 5: desmontar sistemas de arquivos desnecessários

Etapa 6: configurar os pontos de montagem

Etapa 7: montar os volumes de recuperação

Etapa 8: recuperar o SYSTEMDB

Etapa 9: recuperar o banco de dados do Locatário

Execute `azacsnap -c backup` no site de DR

Próximas etapas

Comentários

Recursos adicionais

Compartilhar via

Recuperação de desastre usando a ferramenta de Instantâneo Consistente do Aplicativo Azure

Introdução

Pré-requisitos para a configuração da recuperação de desastre

Configurar recuperação de desastre

Monitorar a replicação de dados do site Primário para DR

Executar um failover para um site de DR

Exemplo de execução de Recuperação de Desastres

Etapa 1: obter os detalhes de volume do nó de DR

Etapa 2: desligar o HANA no Site primário

Etapa 3: desligar o HANA no site de DR

Etapa 4: restaurar os volumes

Etapa 5: desmontar sistemas de arquivos desnecessários

Etapa 6: configurar os pontos de montagem

Etapa 7: montar os volumes de recuperação

Etapa 8: recuperar o SYSTEMDB

Etapa 9: recuperar o banco de dados do Locatário

Execute azacsnap -c backup no site de DR

Próximas etapas

Comentários

Recursos adicionais

Execute `azacsnap -c backup` no site de DR