Guida introduttiva: Eseguire query su Apache HBase in Azure HDInsight con HBase Shell
In questo argomento di avvio rapido si apprenderà come usare la shell di Apache HBase per creare una tabella HBase, inserire dati e quindi eseguire query sulla tabella.
Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare.
Prerequisiti
Un cluster Apache HBase. Per creare un cluster HDInsight, vedere Creare un cluster. Assicurarsi di scegliere il tipo di cluster HBase.
Un client SSH. Per altre informazioni, vedere Connettersi a HDInsight (Apache Hadoop) con SSH.
Creare una tabella e manipolare i dati
Per la maggior parte delle persone, i dati vengono visualizzati in formato tabulare:
In HBase, che rappresenta un'implementazione di Cloud BigTable, gli stessi dati sono simili a:
È possibile usare SSH per connettersi ai cluster HBase e quindi usare la shell di Apache HBase per creare tabelle HBase, inserire dati ed eseguire query sui dati.
Usare il comando
ssh
per connettersi al cluster HBase. Modificare il comando seguente sostituendoCLUSTERNAME
con il nome del cluster in uso e quindi immettere il comando:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Usare il comando
hbase shell
per avviare la shell interattiva di HBase. Immettere il comando seguente nella connessione SSH:hbase shell
Usare il comando
create
per creare una tabella HBase con famiglie a due colonne. Immettere il comando seguente:create 'Contacts', 'Personal', 'Office'
Usare il comando
list
per elencare tutte le tabelle in HBase. Immettere il comando seguente:list
Usare il comando
put
per inserire i valori per una determinata colonna in una determinata riga di una determinata tabella. Immettere il comando seguente:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Usare il comando
scan
per analizzare e restituire i dati della tabellaContacts
. Immettere il comando seguente:scan 'Contacts'
Usare il comando
get
per recuperare il contenuto di una riga. Immettere il comando seguente:get 'Contacts', '1000'
Verranno visualizzati risultati simili a quelli che si ottengono usando il comando
scan
perché esiste solo una riga.Usare il comando
delete
per eliminare il valore di una cella in una tabella. Immettere il comando seguente:delete 'Contacts', '1000', 'Office:Address'
Usare il comando
disable
per disabilitare la tabella. Immettere il comando seguente:disable 'Contacts'
Usare il comando
drop
per eliminare una tabella da HBase. Immettere il comando seguente:drop 'Contacts'
Usare il comando
exit
per interrompere la shell interattiva di HBase. Immettere il comando seguente:exit
Per altre informazioni sullo schema di tabella HBase, vedere Introduzione alla progettazione dello schema Apache HBase. Per altri comandi HBase, vedere Apache HBase Reference Guide (Guida di riferimento di Apache HBase).
Pulire le risorse
Al termine dell'argomento di avvio rapido, può essere opportuno eliminare il cluster. Con HDInsight, i dati vengono archiviati in Archiviazione di Azure ed è possibile eliminare tranquillamente un cluster quando non viene usato. Vengono addebitati i costi anche per i cluster HDInsight che non sono in uso. Poiché i costi per il cluster sono decisamente superiori a quelli per l'archiviazione, economicamente ha senso eliminare i cluster quando non vengono usati.
Per eliminare un cluster, vedere Eliminare un cluster HDInsight tramite browser, PowerShell o l'interfaccia della riga di comando di Azure.
Passaggi successivi
In questo argomento di avvio rapido si è appreso come usare la shell di Apache HBase per creare una tabella HBase, inserire dati e quindi eseguire query sulla tabella. Per altre informazioni sui dati archiviati in HBase, vedere l'articolo successivo che illustrerà come eseguire query con Apache Spark.