Determinar estratégias de migração e alta disponibilidade no HDInsight HBase
Um desafio frequente que os clientes enfrentam é migrar clusters HBase do local ou entre versões durante upgrades de cluster. O HDInsight HBase oferece as opções abaixo para migrar, atualizar e proteger contra perda de dados.
Copie a pasta hbase
A estratégia de copiar a pasta /hbase é normalmente usada para backups ou migrações periódicas. O HDInsight HBase armazena todos os seus arquivos de dados e metadados que foram liberados para o disco na pasta /hbase.
Nota
Esse processo não oferece a replicação em tempo real entre clusters e nem a granularidade da migração de tabelas específicas.
Execute as etapas abaixo em sequência para fazer backup/migrar um cluster HDInsight. O HDInsight /hbase é armazenado no seguinte local: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase
- Descubra o caminho onde a pasta /hbase está localizada no cluster de origem
- Pare todas as gravações no cluster de origem e force uma liberação no disco para garantir que nada esteja na memória.
- Copie os dados em /hbase para o destino do Armazenamento do Azure usando AzCopy para Armazenamento de Blob ou AdlCopy para Armazenamento Data Lake.
- Se isso for para um cenário de DR, os dados podem ser armazenados em uma região diferente periodicamente para uso futuro na eventualidade de um desastre.
- Se isso for para uma migração do HBase, os dados poderão ser copiados para a pasta /hbase recém-criada no cluster HBase do HDInsight.
Mais informações sobre o processo de cópia da pasta hbase do HBase podem ser encontradas na documentação de Cópia da pasta hbase do HDInsight.
Exportar e Importar
Exportar e importar oferece um melhor controle do processo de backup e você pode optar por fazer backup de tabelas específicas em vez de toda a pasta. Esse processo usa o utilitário Exportar do cluster HBase para exportar tabelas selecionadas para o armazenamento local anexado ao cluster. Pós-exportação as tabelas que podem ser importadas do cluster de destino. Mais informações sobre como trabalhar com Exportação e Importação podem ser encontradas na documentação de Exportação e Importação do HBase do HDInsight.
Copiar tabelas
As tabelas de cópia são um mecanismo de cópia eficiente e permitem um controle refinado sobre o processo de cópia total ou parcial da tabela e usam os caminhos de leitura e gravação do HBase para copiar parte ou toda a tabela, linha por linha, da origem ao destino. Os clusters de origem e destino podem ser os mesmos ou clusters diferentes. Mais informações sobre como trabalhar com tabelas de cópia podem ser encontradas na documentação de tabelas de cópia do HBase do HDInsight.
Instantâneos
Os snapshots podem habilitar backups point-in-time para habilitar os requisitos de reversão de tabela. Um instantâneo não é uma cópia dos dados reais da tabela, mas são informações de metadados que podem ajudar os administradores a voltar a um estado anterior das tabelas. Os snapshots operam em um nível HDFS e não envolvem servidores Master e Region para otimizar recursos de cluster. Mais informações sobre como trabalhar com instantâneos podem ser encontradas na documentação do HDInsight HBase Snapshots.
Replicação
O recurso de replicação do HBase pode ser usado para garantir alta disponibilidade e continuidade de negócios durante um desastre. Os dados são copiados entre clusters de forma assíncrona e as replicações podem funcionar dentro de regiões e entre regiões do Azure, garantindo modelos HADR globais. Mais informações sobre como trabalhar com a Replicação do HBase podem ser encontradas na documentação da Replicação do HBase do HDInsight.