Condividi tramite


Guida introduttiva: Eseguire query su Apache HBase in Azure HDInsight con HBase Shell

In questo argomento di avvio rapido si apprenderà come usare la shell di Apache HBase per creare una tabella HBase, inserire dati e quindi eseguire query sulla tabella.

Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare.

Prerequisiti

Creare una tabella e manipolare i dati

Per la maggior parte delle persone, i dati vengono visualizzati in formato tabulare:

HDInsight Apache HBase tabular data.

In HBase, che rappresenta un'implementazione di Cloud BigTable, gli stessi dati sono simili a:

HDInsight Apache HBase BigTable data.

È possibile usare SSH per connettersi ai cluster HBase e quindi usare la shell di Apache HBase per creare tabelle HBase, inserire dati ed eseguire query sui dati.

  1. Usare il comando ssh per connettersi al cluster HBase. Modificare il comando seguente sostituendo CLUSTERNAME con il nome del cluster in uso e quindi immettere il comando:

    ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
    
  2. Usare il comando hbase shell per avviare la shell interattiva di HBase. Immettere il comando seguente nella connessione SSH:

    hbase shell
    
  3. Usare il comando create per creare una tabella HBase con famiglie a due colonne. Immettere il comando seguente:

    create 'Contacts', 'Personal', 'Office'
    
  4. Usare il comando list per elencare tutte le tabelle in HBase. Immettere il comando seguente:

    list
    
  5. Usare il comando put per inserire i valori per una determinata colonna in una determinata riga di una determinata tabella. Immettere il comando seguente:

    put 'Contacts', '1000', 'Personal:Name', 'John Dole'
    put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001'
    put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002'
    put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
    
  6. Usare il comando scan per analizzare e restituire i dati della tabella Contacts. Immettere il comando seguente:

    scan 'Contacts'
    
  7. Usare il comando get per recuperare il contenuto di una riga. Immettere il comando seguente:

    get 'Contacts', '1000'
    

    Verranno visualizzati risultati simili a quelli che si ottengono usando il comando scan perché esiste solo una riga.

  8. Usare il comando delete per eliminare il valore di una cella in una tabella. Immettere il comando seguente:

    delete 'Contacts', '1000', 'Office:Address'
    
  9. Usare il comando disable per disabilitare la tabella. Immettere il comando seguente:

    disable 'Contacts'
    
  10. Usare il comando drop per eliminare una tabella da HBase. Immettere il comando seguente:

    drop 'Contacts'
    
  11. Usare il comando exit per interrompere la shell interattiva di HBase. Immettere il comando seguente:

    exit
    

Per altre informazioni sullo schema di tabella HBase, vedere Introduzione alla progettazione dello schema Apache HBase. Per altri comandi HBase, vedere Apache HBase Reference Guide (Guida di riferimento di Apache HBase).

Pulire le risorse

Al termine dell'argomento di avvio rapido, può essere opportuno eliminare il cluster. Con HDInsight, i dati vengono archiviati in Archiviazione di Azure ed è possibile eliminare tranquillamente un cluster quando non viene usato. Vengono addebitati i costi anche per i cluster HDInsight che non sono in uso. Poiché i costi per il cluster sono decisamente superiori a quelli per l'archiviazione, economicamente ha senso eliminare i cluster quando non vengono usati.

Per eliminare un cluster, vedere Eliminare un cluster HDInsight tramite browser, PowerShell o l'interfaccia della riga di comando di Azure.

Passaggi successivi

In questo argomento di avvio rapido si è appreso come usare la shell di Apache HBase per creare una tabella HBase, inserire dati e quindi eseguire query sulla tabella. Per altre informazioni sui dati archiviati in HBase, vedere l'articolo successivo che illustrerà come eseguire query con Apache Spark.