Migratie- en strategieën voor hoge beschikbaarheid bepalen in HDInsight HBase
Een veelvoorkomende uitdaging waarmee klanten te maken hebben, is het migreren van HBase-clusters vanaf on-premises of tussen versies tijdens clusterupgrades. HDInsight HBase biedt de onderstaande opties voor het migreren, upgraden en beveiligen van gegevensverlies.
De hbase-map kopiëren
De strategie voor het kopiëren van de map /hbase wordt doorgaans gebruikt voor periodieke back-ups of migraties. HDInsight HBase slaat alle bijbehorende gegevens- en metagegevensbestanden op die zijn leeggemaakt naar schijf onder de map /hbase.
Notitie
Dit proces biedt geen realtime-replicatie tussen clusters en biedt geen granulariteit voor het migreren van specifieke tabellen.
Voer de onderstaande stappen in volgorde uit om een back-up van een HDInsight-cluster te maken/te migreren. HDInsight /hbase wordt op de volgende locatie opgeslagen: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase
- Het pad achterhalen waar de map /hbase zich in het broncluster bevindt
- Stop alle schrijfbewerkingen naar het broncluster en dwing een flush naar de schijf af om ervoor te zorgen dat er niets in het geheugen aanwezig is.
- Kopieer de gegevens in /hbase naar de doelbestemming van Azure Storage met behulp van AzCopy voor Blob Storage of AdlCopy voor Data Lake Storage.
- Als dit voor een DR-scenario geldt, kunnen de gegevens periodiek in een andere regio worden opgeslagen voor toekomstig gebruik in de toekomst van een noodgeval.
- Als dit een voor een HBase-migratie is, kunnen de gegevens worden gekopieerd naar de map /hbase, die zojuist is gemaakt, hdInsight HBase-cluster.
Meer informatie over het kopieerproces van HBase hbase-mappen vindt u in de documentatie over het kopiëren van hdInsight-hbase-mappen.
Exporteren en importeren
Exporteren en importeren biedt betere controle over het back-upproces en u kunt ervoor kiezen om een back-up te maken van specifieke tabellen in plaats van de hele map. Dit proces maakt gebruik van het hulpprogramma Exporteren van het HBase-cluster om geselecteerde tabellen te exporteren naar de lokale opslag die is gekoppeld aan het cluster. Exporteer de tabellen die vervolgens vanuit het doelcluster kunnen worden geïmporteerd. Meer informatie over het werken met Exporteren en Importeren vindt u in de hdInsight HBase-documentatie voor exporteren en importeren.
Tabellen kopiëren
Kopieertabellen zijn een efficiënt kopieermechanisme en maken nauwkeurige controle mogelijk over het volledige of gedeeltelijke kopieerproces van de tabel en maakt gebruik van de lees- en schrijfpaden van HBase om een deel of alle tabelrijen per rij van bron naar bestemming te kopiëren. De bron- en doelclusters kunnen hetzelfde of verschillende clusters zijn. Meer informatie over het werken met Kopieertabellen vindt u in de documentatie over HDInsight HBase Copy Tables.
Momentopnamen
Momentopnamen kunnen back-ups naar een bepaald tijdstip inschakelen om vereisten voor terugdraaien van tabellen in te schakelen. Een momentopname is geen kopie van de werkelijke tabelgegevens, maar metagegevensgegevens die beheerders kunnen helpen terug te gaan naar een eerdere status van de tabellen. Momentopnamen werken op HDFS-niveau en omvatten geen master- en regioservers voor het optimaliseren van clusterbronnen. Meer informatie over het werken met momentopnamen vindt u in de documentatie voor HDInsight HBase Snapshots.
Replicatie
HBase-replicatiefunctie kan worden gebruikt om hoge beschikbaarheid en bedrijfscontinuïteit te garanderen tijdens een noodgeval. Gegevens worden gekopieerd tussen clusters op een asynchrone manier en replicaties kunnen binnen regio's en tussen Azure-regio's werken, waardoor globale HADR-modellen worden gegarandeerd. Meer informatie over het werken met HBase-replicatie vindt u in hdinsight HBase-replicatiedocumentatie.