Określanie strategii migracji i wysokiej dostępności w bazie danych HBase usługi HDInsight
Częstym wyzwaniem, z jakim borykają się klienci, jest migrowanie klastrów HBase ze środowiska lokalnego lub między wersjami podczas uaktualniania klastra. Baza HBase usługi HDInsight oferuje poniższe opcje migracji, uaktualniania i ochrony przed utratą danych.
Kopiowanie folderu hbase
Strategia kopiowania folderu /hbase jest zwykle używana do okresowych kopii zapasowych lub migracji. Baza HBase usługi HDInsight przechowuje wszystkie pliki danych i metadanych, które zostały opróżnione na dysk w folderze /hbase .
Uwaga
Ten proces nie oferuje replikacji w czasie rzeczywistym między klastrami i nie oferuje szczegółowości migrowania określonych tabel.
Uruchom poniższe kroki w sekwencji, aby utworzyć kopię zapasową/przeprowadzić migrację klastra usługi HDInsight. Usługa HDInsight /hbase jest przechowywana w następującej lokalizacji: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase
- Określ ścieżkę, w której znajduje się folder /hbase w klastrze źródłowym
- Zatrzymaj wszystkie operacje zapisu w klastrze źródłowym i wymuś opróżnienie dysku, aby upewnić się, że nic nie jest w pamięci.
- Skopiuj dane z lokalizacji /hbase do docelowego miejsca docelowego usługi Azure Storage przy użyciu narzędzia AzCopy dla usługi Blob Storage lub narzędzia AdlCopy dla usługi Data Lake Storage.
- W przypadku scenariusza odzyskiwania po awarii dane mogą być okresowo przechowywane w innym regionie do użytku w przyszłości w przypadku awarii.
- Jeśli dotyczy to migracji bazy danych HBase, dane można skopiować do folderu /hbase nowo utworzonego klastra HBase usługi HDInsight.
Więcej informacji na temat procesu kopiowania folderów HBase hbase można znaleźć w dokumentacji kopiowania folderu hbase usługi HDInsight.
Eksport i import
Eksportowanie i importowanie zapewnia lepszą kontrolę nad procesem tworzenia kopii zapasowej i można utworzyć kopię zapasową określonych tabel zamiast całego folderu. Ten proces używa narzędzia Eksportuj klastra HBase do eksportowania wybranych tabel do magazynu lokalnego dołączonego do klastra. Po wyeksportowaniu tabel, które można następnie zaimportować z klastra docelowego. Więcej informacji na temat pracy z eksportowaniem i importowaniem można znaleźć w dokumentacji eksportowania i importowania bazy danych HBase usługi HDInsight.
Kopiowanie tabel
Tabele kopiowania są wydajnym mechanizmem kopiowania i umożliwiają precyzyjną kontrolę nad procesem kopiowania pełnej lub częściowej tabeli i używają ścieżek odczytu i zapisu bazy danych HBase do kopiowania części lub całego wiersza tabeli według wiersza ze źródła do miejsca docelowego. Klastry źródłowe i docelowe mogą być takie same lub różne. Więcej informacji na temat pracy z tabelami kopiowania można znaleźć w dokumentacji tabel kopiowania bazy danych HBase w usłudze HDInsight.
Migawki
Migawki mogą umożliwiać tworzenie kopii zapasowych punktów w czasie w celu włączenia wymagań dotyczących wycofywania tabel. Migawka nie jest kopią rzeczywistych danych tabeli, ale jest informacjami o metadanych, które mogą pomóc administratorom wrócić do poprzedniego stanu tabel. Migawki działają na poziomie systemu plików HDFS i nie obejmują serwerów głównych i regionów do optymalizacji zasobów klastra. Więcej informacji na temat pracy z migawkami można znaleźć w dokumentacji migawek HBase usługi HDInsight.
Replikacja
Funkcja replikacji bazy HBase może służyć do zapewnienia wysokiej dostępności i ciągłości działania podczas awarii. Dane są kopiowane między klastrami w sposób asynchroniczny, a replikacje mogą działać w regionach i między regionami świadczenia usługi Azure zapewniającymi globalne modele HADR. Więcej informacji na temat pracy z replikacją bazy danych HBase można znaleźć w dokumentacji replikacji bazy danych HBase usługi HDInsight.