Recuperação de desastres usando a ferramenta Instantâneo Consistente de Aplicativo do Azure
Este artigo explica como executar a recuperação de desastres ao usar a ferramenta Instantâneo Consistente do Aplicativo do Azure que você pode usar com os Arquivos NetApp do Azure.
Importante
Esta operação aplica-se apenas à Instância Grande do Azure.
Introdução
A plataforma de Instância Grande do Azure também pode ter um site de Recuperação de Desastres configurado para o qual os instantâneos de volume de armazenamento podem ser replicados. Se os instantâneos tiverem sido configurados corretamente com essa configuração, é possível executar uma recuperação de desastres neste site. Este documento destina-se a ser um guia para executar a recuperação de desastres para esta configuração.
Pré-requisitos para a configuração da recuperação de desastres
Os pré-requisitos a seguir devem ser atendidos antes de planejar o failover de recuperação de desastres.
- Você tem um nó DR provisionado no site de DR. Existem duas opções para DR. Uma é DR normal e outra é DR polivalente.
- Você tem a replicação de armazenamento funcionando. A equipe de operações da Microsoft executa a configuração de replicação de armazenamento no momento do provisionamento de DR automaticamente. Você pode monitorar a replicação de armazenamento usando o comando
azacsnap -c details --details replication
no site de DR. - Você configurou e configurou instantâneos de armazenamento no local principal.
- Você tem uma instância HANA instalada no site de DR para o primário com o mesmo SID que a instância primária.
- Você lê e entende o procedimento de failover de DR descrito em SAP HANA Large Instances alta disponibilidade e recuperação de desastres no Azure
- Você configurou e configurou instantâneos de armazenamento no local de DR.
- Um arquivo de configuração (por exemplo,
DR.json
) foi criado com os volumes de armazenamento DR e informações associadas no servidor DR. - Você concluiu as etapas no site de DR para:
- Habilite a comunicação com o armazenamento.
- Habilite a comunicação com o SAP HANA.
Configurar a recuperação após desastre
A Microsoft oferece suporte à replicação no nível de armazenamento para recuperação de DR. Há duas maneiras de configurar a DR.
Uma é normal e outra é polivalente. Na DR normal, você tem uma instância dedicada no local de DR para failover. No cenário de DR multiuso, você tem outra instância de QA ou HANA de desenvolvimento em execução na unidade de instância grande HANA no site de DR. Mas você também instalou uma instância HANA pré-instalada que está inativa e tem o mesmo SID que a instância HANA que você deseja fazer failover para essa unidade HANA Large Instance. As operações da Microsoft configuram o ambiente para você, incluindo a replicação de armazenamento com base na entrada fornecida no Formulário de Solicitação de Serviço (SRF) no momento da integração.
Importante
Certifique-se de que todos os pré-requisitos sejam atendidos para a configuração de DR.
Monitorar a replicação de dados do local primário para o local de DR
A equipe de operações da Microsoft já gerencia e monitora o link de DR do site primário para o site de DR.
Você pode monitorar a replicação de dados do servidor primário para o servidor DR usando o comando azacsnap -c details --details replication
snapshot .
Executar um failover para o site de DR
Execute o comando failover no site DR (azacsnap -c restore --restore revertvolume
).
Importante
O azacsnap -c restore --restore revertvolume
comando interrompe a replicação de armazenamento do local de produção para o local de DR. Você deve entrar em contato com o Microsoft Operations para configurar a replicação novamente. Depois que a replicação for reativada, todos os dados no armazenamento DR para esse SID serão inicializados. O comando que executa o failover disponibiliza o instantâneo de armazenamento replicado mais recentemente. Se você precisar restaurar para um instantâneo mais antigo, abra uma solicitação de suporte para que as operações possam ajudar a fornecer um instantâneo anterior restaurado no site de DR.
Em um alto nível, aqui estão as etapas a serem seguidas para failover de DR:
- Você deve desligar a instância HANA no site primário . Essa ação é necessária somente se você estiver realmente fazendo o failover para o site de DR para não ter inconsistências de dados.
- Desligue a instância HANA no nó DR para o SID de produção.
- Execute o comando
azacsnap -c restore --restore revertvolume
no nó DR com o SID a ser recuperado- O comando quebra o link de replicação de armazenamento do site primário para o local de DR
- O comando restaura apenas o volume /data e /logbackups, o volume /shared NÃO é recuperado, mas usa o /shared existente para SID no local de DR.
- Monte o volume /data e /logbackups – certifique-se de adicioná-lo ao arquivo fstab
- Restaure o instantâneo HANA SYSTEMDB. O estúdio HANA mostra apenas o instantâneo HANA mais recente disponível sob o instantâneo de armazenamento restaurado como parte da execução do comando
azacsnap -c restore --restore revertvolume
. - Recupere o banco de dados do locatário.
- Inicie a instância HANA no site de DR para o SID de produção (exemplo: H80 neste caso).
- Realize testes.
Exemplo de execução de recuperação de desastres
Esta subseção descreve as etapas detalhadas para um failover para o site de recuperação de desastres.
Etapa 1: Obter os detalhes do volume do nó DR
Execute o comando df –h
para listar os sistemas de arquivos e os volumes associados aos quais fazer referência após o failover.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Etapa 2: Desligue o HANA no site primário
Se estiver executando um failover completo de cargas de trabalho de produção e for possível conectar-se ao local de produção principal, desligue a(s) instância(s) do SAP HANA que está sendo transferida para DR.
Por exemplo, se estiver conectado como root, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <o sid> pelo seu SAP HANA SID.
su - <sid>adm
HDB stop
Etapa 3: Desligue o HANA no site de DR
É importante desligar o SAP HANA no site de DR antes de restaurar os volumes.
Por exemplo, se estiver conectado como root, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <o sid> pelo seu SAP HANA SID.
su - <sid>adm
HDB stop
Importante
Verifique se as instâncias HANA no site de DR estão off-line antes de restaurar quaisquer volumes.
Etapa 4: Restaurar os volumes
azacsnap -c restore --restore revertvolume --dbsid H80
Saída do comando DR failover.
azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
Production HANA instance in the Disaster Recovery Location either as a
stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.
CAUTION: a failback will be required after running this command and failback
might not be a quick process and will require multiple steps in coordination
with Microsoft Operations.
Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
********************* HANA DR Restore Steps **********************************
* Please complete the following steps to recover your HANA database: *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones. *
* e.g. mkdir /hana/logbackups/H99_SOURCE *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as *
* output above into /etc/fstab of DR Server. *
* 3. Mount newly added filesystems. *
* 4. Perform HANA Snapshot Recovery using HANA Studio. *
********************************************************************************
Nota
As etapas no final da exibição do console precisam ser executadas para concluir a preparação do armazenamento para um failover de DR.
Etapa 5: Desmontar sistemas de arquivos desnecessários
Execute o comando umount
para desmontar os sistemas de arquivos/volumes que não são necessários.
umount <Mount point>
Desmonte os dados e registre os pontos de montagem de backup. Você pode ter vários pontos de montagem de dados no cenário de expansão.
Etapa 6: Configurar os pontos de montagem
Modifique o arquivo /etc/fstab
para comentar as entradas de dados e backups de log para o SID primário (neste exemplo, SID=H80) e adicione as novas entradas de ponto de montagem criadas a partir dos volumes DR do site primário. As novas entradas de ponto de montagem são fornecidas na saída do comando.
Comente os pontos de montagem existentes em execução no site DR com o
#
caractere:#172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Adicione as seguintes linhas a
/etc/fstab
esta deve ser a mesma saída do comando
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp /hana/data/H80/mnt00001 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0 10.50.251.36:/hana_log_backups_h80_t020_xdp01 /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
Etapa 7: Monte os volumes de recuperação
Execute o comando mount –a
para montar todos os pontos de montagem.
mount -a
Agora, se você executar df –h
, você deve ver os *_dp
volumes montados.
df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250
Etapa 8: Recuperar o SYSTEMDB
No HANA Studio, clique com o botão direito do mouse na instância SYSTEMDB e escolha "Backup e recuperação" e, em seguida, "Recuperar banco de dados do sistema"
Consulte o guia para recuperar um banco de dados de um snapshot, especificamente o SYSTEMDB.
Etapa 9: Recuperar o banco de dados do locatário
No HANA Studio, clique com o botão direito do mouse na instância do SYSTEMDB e escolha "Backup e recuperação" e, em seguida, "Recuperar banco de dados do locatário".
Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o(s) banco(s) de dados TENANT.
Executar azacsnap -c backup
no site de DR
Se você estiver executando backups baseados em instantâneo no site de DR, o Nome do Servidor HANA configurado no azacsnap
arquivo de configuração no site de DR deverá ser o mesmo que o nome do servidor de produção.
Importante
Executando o azacsnap -c backup
pode criar instantâneos de armazenamento no local de DR, eles não são replicados automaticamente para outro site. Trabalhe com o Microsoft Operations para entender melhor o retorno de todos os arquivos ou dados ao local de produção original.