Recuperação de desastre usando a ferramenta de Instantâneo Consistente do Aplicativo Azure
Este artigo explica como executar a recuperação de desastres ao usar a ferramenta de Instantâneo Consistente com o Aplicativo Azure que você pode usar com Azure NetApp Files.
Importante
Esta operação se aplica somente à Instância Grande do Azure.
Introdução
A plataforma de Instância Grande do Azure também pode ter um site de Recuperação de Desastre configurado no qual os instantâneos do volume de armazenamento podem ser replicados. Se os instantâneos tiverem sido configurados corretamente com essa configuração, será possível executar uma Recuperação de Desastre neste site. Este documento destina-se a ser um guia para executar a Recuperação de Desastres para essa configuração.
Pré-requisitos para a configuração da recuperação de desastre
Os pré-requisitos a seguir devem ser atendidos antes de você planejar o failover da recuperação de desastre.
- Você tem um nó de DR (recuperação de desastres) provisionado no local de recuperação de desastre. Há duas opções para recuperação de desastre. Uma é a DR normal e a outra é a DR multipropósito.
- A replicação de armazenamento está funcionando. A equipe de operações da Microsoft executa a configuração de replicação de armazenamento no momento do provisionamento de DR automaticamente. Você pode monitorar a replicação de armazenamento usando o comando
azacsnap -c details --details replication
no site de recuperação de desastre. - Você instalou e configurou instantâneos de armazenamento no local principal.
- Você tem uma instância do HANA instalada no site de DR para o primário com o mesmo SID que a instância primária.
- Você lê e entende o procedimento de Failover de DR descrito em Alta disponibilidade e recuperação de desastre de Instâncias Grandes do SAP HANA no Azure
- Você instalou e configurou instantâneos de armazenamento no local da DR.
- Um arquivo de configuração (por exemplo,
DR.json
) foi criado com os volumes de armazenamento de DR e as informações associadas no servidor de DR. - Você concluiu as etapas no site de recuperação de desastre para:
- Habilitar a comunicação com o armazenamento.
- Habilitar a comunicação com o SAP HANA.
Configurar recuperação de desastre
A Microsoft dá suporte à replicação do nível de armazenamento para recuperação de desastre. Há duas maneiras de configurar a DR.
Uma é a normal e a outra é a multipropósito. Na recuperação de desastre normal, você tem uma instância dedicada no local da recuperação de desastres para failover. No cenário de recuperação de desastre multipropósito, você tem outra instância de QA ou de desenvolvimento do HANA em execução na unidade de instância grande do HANA no local de recuperação de desastre. Mas você também instalou uma instância do HANA pré-instalada que está inativa e tem o mesmo SID que a instância do HANA que você deseja fazer failover para essa unidade de Instância Grande do HANA. A equipe de operações da Microsoft configura o ambiente para você, incluindo a replicação de armazenamento com base na entrada fornecida no SRF (Formulário de Solicitação de Serviço) no momento da integração.
Importante
Verifique se todos os pré-requisitos foram atendidos para a configuração de DR.
Monitorar a replicação de dados do site Primário para DR
A equipe de operações da Microsoft já gerencia e monitora o link de recuperação de desastre do site primário para o site de recuperação de desastre.
Você pode monitorar a replicação de dados do servidor primário para o servidor de DR usando o comando de instantâneo azacsnap -c details --details replication
.
Executar um failover para um site de DR
Execute o comando failover no site de DR (azacsnap -c restore --restore revertvolume
).
Importante
O comando azacsnap -c restore --restore revertvolume
interrompe a replicação de armazenamento do site de Produção para o site de DR. Você deve entrar em contato com a Microsoft Operations para configurar a replicação novamente. Depois que a replicação for habilitada novamente, todos os dados no armazenamento de DR para esse SID serão inicializados. O comando que executa o failover disponibiliza o instantâneo de armazenamento replicado mais recentemente. Se você precisar restaurar de volta para um instantâneo mais antigo, abra uma solicitação de suporte para que a equipe de operações possa ajudar a fornecer um instantâneo anterior restaurado no site de DR.
Em um alto nível, aqui estão as etapas a serem seguidas para o failover de DR:
- Você deve desligar a instância do HANA no site primário. Essa ação é necessária apenas se você estiver realmente fazendo o failover para o site de DR para que você não tenha inconsistências de dados.
- Desligue a instância do HANA no nó de DR para o SID de produção.
- Executar o comando
azacsnap -c restore --restore revertvolume
no nó de DR com o SID a ser recuperado- O comando interrompe o link de replicação de armazenamento do site Primário para o de DR
- O comando restaura apenas os volumes /data e /logbackups. O volume /shared NÃO é recuperado, mas, em vez disso, ele usa o /shared existente para o SID no local de DR.
- Montar o volume /data e /logbackups – certifique-se de adicioná-lo ao arquivo fstab
- Restaure o instantâneo do HANA SYSTEMDB. O estúdio do HANA mostra apenas o instantâneo mais recente do HANA disponível no instantâneo de armazenamento restaurado como parte da execução do comando
azacsnap -c restore --restore revertvolume
. - Recupere o banco de dados do locatário.
- Inicie a instância do HANA no site de DR para o SID de Produção (exemplo: H80 nesse caso).
- Execute os testes.
Exemplo de execução de Recuperação de Desastres
Esta subseção descreve as etapas detalhadas para um failover para o site de Recuperação de Desastre.
Etapa 1: obter os detalhes de volume do nó de DR
Execute o comando df –h
para listar os sistemas de arquivos e os volumes associados aos quais fazer referência após o failover.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Etapa 2: desligar o HANA no Site primário
Se estiver executando um failover completo de cargas de trabalho de produção e for possível se conectar ao site de produção primário, desligue as instâncias do SAP HANA que passarão por failover para DR.
Por exemplo, se estiver conectado como raiz, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <sid> pelo SID do SAP HANA.
su - <sid>adm
HDB stop
Etapa 3: desligar o HANA no site de DR
É importante desligar o SAP HANA no site de DR antes de restaurar os volumes.
Por exemplo, se estiver conectado como raiz, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <sid> pelo SID do SAP HANA.
su - <sid>adm
HDB stop
Importante
Verifique se as instâncias do HANA no site de DR estão offline antes de restaurar quaisquer volumes.
Etapa 4: restaurar os volumes
azacsnap -c restore --restore revertvolume --dbsid H80
Saída do comando de failover de DR.
azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
Production HANA instance in the Disaster Recovery Location either as a
stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.
CAUTION: a failback will be required after running this command and failback
might not be a quick process and will require multiple steps in coordination
with Microsoft Operations.
Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
********************* HANA DR Restore Steps **********************************
* Please complete the following steps to recover your HANA database: *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones. *
* e.g. mkdir /hana/logbackups/H99_SOURCE *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as *
* output above into /etc/fstab of DR Server. *
* 3. Mount newly added filesystems. *
* 4. Perform HANA Snapshot Recovery using HANA Studio. *
********************************************************************************
Observação
As etapas no final da tela do console precisam ser executadas para concluir a preparação de armazenamento para um failover de DR.
Etapa 5: desmontar sistemas de arquivos desnecessários
Execute o comando umount
para desmontar os sistemas de arquivos/volumes que não são necessários.
umount <Mount point>
Desmonte os pontos de montagem de dados e backup de log. Você pode ter vários pontos de montagem de dados no cenário de expansão.
Etapa 6: configurar os pontos de montagem
Modifique o arquivo /etc/fstab
para comentar as entradas de backup de dados e de log para o SID primário (neste exemplo, SID=H80) e adicionar as novas entradas de ponto de montagem criadas a partir dos volumes de DR do site primário. As novas entradas de ponto de montagem são fornecidas na saída do comando.
Comente os pontos de montagem existentes em execução no site de DR com o caractere
#
:#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Adicione as linhas a seguir a
/etc/fstab
deve ser a mesma saída do comando
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Etapa 7: montar os volumes de recuperação
Execute o comando mount –a
para montar todos os pontos de montagem.
mount -a
Agora, se você executar df –h
, deverá ver os volumes *_dp
montados.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Etapa 8: recuperar o SYSTEMDB
No HANA Studio, clique com o botão direito do mouse em instância do SYSTEMDB e escolha "Backup e Recuperação" e, em seguida, "Recuperar Banco de Dados do Sistema"
Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o SYSTEMDB.
Etapa 9: recuperar o banco de dados do Locatário
No HANA Studio, clique com o botão direito do mouse em instância do SYSTEMDB e escolha "Backup e Recuperação" e, em seguida, "Recuperar Banco de Dados do Locatário".
Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o banco de dados do LOCATÁRIO.
Execute azacsnap -c backup
no site de DR
Se você estiver executando backups baseados em instantâneo no site de DR, o Nome do Servidor do HANA configurado no arquivo de configuração azacsnap
no site de DR deverá ser igual ao nome do servidor de produção.
Importante
A execução do azacsnap -c backup
pode criar instantâneos de armazenamento no site de DR, eles não são replicados automaticamente para outro site. Trabalhe com o Microsoft Operations para entender melhor o retorno de quaisquer arquivos ou dados para o site de produção original.