Udostępnij za pośrednictwem


Szybki start: wykonywanie zapytań o bazę danych Apache HBase w usłudze Azure HDInsight przy użyciu powłoki HBase

Z tego przewodnika Szybki start dowiesz się, jak za pomocą powłoki Apache HBase utworzyć tabelę HBase, wstawić dane, a następnie wykonać zapytanie względem tabeli.

Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Wymagania wstępne

Tworzenie tabeli i manipulowanie danymi

Dla większości użytkowników dane są wyświetlane w formacie tabelarycznym:

HDInsight Apache HBase tabular data.

W bazie danych HBase (implementacja rozwiązania Cloud BigTable) te same dane wyglądają następująco:

HDInsight Apache HBase BigTable data.

Za pomocą protokołu SSH możesz nawiązać połączenie z klastrami HBase, a następnie użyć powłoki Apache HBase do tworzenia tabel HBase, wstawiania danych i wykonywania zapytań o dane.

  1. Użyj ssh polecenia , aby nawiązać połączenie z klastrem HBase. Zmodyfikuj poniższe polecenie, zastępując CLUSTERNAME ciąg nazwą klastra, a następnie wprowadź polecenie:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Użyj hbase shell polecenia , aby uruchomić interaktywną powłokę HBase. Wprowadź następujące polecenie w połączeniu SSH:

    hbase shell
    
  3. Użyj create polecenia , aby utworzyć tabelę HBase z dwiema rodzinami kolumn. Podaj następujące polecenie:

    create 'Contacts', 'Personal', 'Office'
    
  4. Użyj list polecenia , aby wyświetlić listę wszystkich tabel w bazie danych HBase. Podaj następujące polecenie:

    list
    
  5. Użyj put polecenia , aby wstawić wartości w określonej kolumnie w określonym wierszu w określonej tabeli. Podaj następujące polecenie:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Użyj scan polecenia , aby skanować i zwracać Contacts dane tabeli. Podaj następujące polecenie:

    scan 'Contacts'
    
  7. Użyj get polecenia , aby pobrać zawartość wiersza. Podaj następujące polecenie:

    get 'Contacts', '1000'
    

    Wyniki są podobne jak w przypadku użycia scan polecenia , ponieważ istnieje tylko jeden wiersz.

  8. Użyj delete polecenia , aby usunąć wartość komórki w tabeli. Podaj następujące polecenie:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Użyj disable polecenia , aby wyłączyć tabelę. Podaj następujące polecenie:

    disable 'Contacts'
    
  10. Użyj drop polecenia , aby usunąć tabelę z bazy danych HBase. Podaj następujące polecenie:

    drop 'Contacts'
    
  11. Użyj exit polecenia , aby zatrzymać interaktywną powłokę HBase. Podaj następujące polecenie:

    exit
    

Aby uzyskać więcej informacji na temat schematu tabeli HBase, zobacz Wprowadzenie do projektu schematu bazy danych Apache HBase. Więcej poleceń bazy danych HBase można znaleźć w Podręczniku bazy danych Apache HBase.

Czyszczenie zasobów

Po zakończeniu pracy z przewodnikiem Szybki start możesz usunąć klaster. Dzięki usłudze HDInsight dane są przechowywane w usłudze Azure Storage, więc można bezpiecznie usunąć klaster, gdy nie jest używany. Opłaty za klaster usługi HDInsight są naliczane nawet wtedy, gdy nie jest używany. Ponieważ opłaty za klaster są wielokrotnie większe niż opłaty za magazyn, ze względów ekonomicznych warto usuwać klastry, gdy nie są używane.

Aby usunąć klaster, zobacz Usuwanie klastra usługi HDInsight przy użyciu przeglądarki, programu PowerShell lub interfejsu wiersza polecenia platformy Azure.

Następne kroki

W tym przewodniku Szybki start przedstawiono sposób użycia powłoki Apache HBase do utworzenia tabeli HBase, wstawiania danych, a następnie wykonywania zapytań względem tabeli. Aby dowiedzieć się więcej o danych przechowywanych w bazie danych HBase, w następnym artykule przedstawiono sposób wykonywania zapytań za pomocą platformy Apache Spark.