Szybki start: wykonywanie zapytań o bazę danych Apache HBase w usłudze Azure HDInsight przy użyciu powłoki HBase
Z tego przewodnika Szybki start dowiesz się, jak za pomocą powłoki Apache HBase utworzyć tabelę HBase, wstawić dane, a następnie wykonać zapytanie względem tabeli.
Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Wymagania wstępne
Klaster Apache HBase. Zobacz Tworzenie klastra, aby utworzyć klaster usługi HDInsight. Upewnij się, że wybrano typ klastra HBase .
Klient SSH. Aby uzyskać więcej informacji, zobacz Łączenie się z usługą HDInsight (Apache Hadoop) przy użyciu protokołu SSH.
Tworzenie tabeli i manipulowanie danymi
Dla większości użytkowników dane są wyświetlane w formacie tabelarycznym:
W bazie danych HBase (implementacja rozwiązania Cloud BigTable) te same dane wyglądają następująco:
Za pomocą protokołu SSH możesz nawiązać połączenie z klastrami HBase, a następnie użyć powłoki Apache HBase do tworzenia tabel HBase, wstawiania danych i wykonywania zapytań o dane.
Użyj
ssh
polecenia , aby nawiązać połączenie z klastrem HBase. Zmodyfikuj poniższe polecenie, zastępującCLUSTERNAME
ciąg nazwą klastra, a następnie wprowadź polecenie:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Użyj
hbase shell
polecenia , aby uruchomić interaktywną powłokę HBase. Wprowadź następujące polecenie w połączeniu SSH:hbase shell
Użyj
create
polecenia , aby utworzyć tabelę HBase z dwiema rodzinami kolumn. Podaj następujące polecenie:create 'Contacts', 'Personal', 'Office'
Użyj
list
polecenia , aby wyświetlić listę wszystkich tabel w bazie danych HBase. Podaj następujące polecenie:list
Użyj
put
polecenia , aby wstawić wartości w określonej kolumnie w określonym wierszu w określonej tabeli. Podaj następujące polecenie:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Użyj
scan
polecenia , aby skanować i zwracaćContacts
dane tabeli. Podaj następujące polecenie:scan 'Contacts'
Użyj
get
polecenia , aby pobrać zawartość wiersza. Podaj następujące polecenie:get 'Contacts', '1000'
Wyniki są podobne jak w przypadku użycia
scan
polecenia , ponieważ istnieje tylko jeden wiersz.Użyj
delete
polecenia , aby usunąć wartość komórki w tabeli. Podaj następujące polecenie:delete 'Contacts', '1000', 'Office:Address'
Użyj
disable
polecenia , aby wyłączyć tabelę. Podaj następujące polecenie:disable 'Contacts'
Użyj
drop
polecenia , aby usunąć tabelę z bazy danych HBase. Podaj następujące polecenie:drop 'Contacts'
Użyj
exit
polecenia , aby zatrzymać interaktywną powłokę HBase. Podaj następujące polecenie:exit
Aby uzyskać więcej informacji na temat schematu tabeli HBase, zobacz Wprowadzenie do projektu schematu bazy danych Apache HBase. Więcej poleceń bazy danych HBase można znaleźć w Podręczniku bazy danych Apache HBase.
Czyszczenie zasobów
Po zakończeniu pracy z przewodnikiem Szybki start możesz usunąć klaster. Dzięki usłudze HDInsight dane są przechowywane w usłudze Azure Storage, więc można bezpiecznie usunąć klaster, gdy nie jest używany. Opłaty za klaster usługi HDInsight są naliczane nawet wtedy, gdy nie jest używany. Ponieważ opłaty za klaster są wielokrotnie większe niż opłaty za magazyn, ze względów ekonomicznych warto usuwać klastry, gdy nie są używane.
Aby usunąć klaster, zobacz Usuwanie klastra usługi HDInsight przy użyciu przeglądarki, programu PowerShell lub interfejsu wiersza polecenia platformy Azure.
Następne kroki
W tym przewodniku Szybki start przedstawiono sposób użycia powłoki Apache HBase do utworzenia tabeli HBase, wstawiania danych, a następnie wykonywania zapytań względem tabeli. Aby dowiedzieć się więcej o danych przechowywanych w bazie danych HBase, w następnym artykule przedstawiono sposób wykonywania zapytań za pomocą platformy Apache Spark.