快速入門:使用 HBase Shell 在 Azure HDInsight 中查詢 Apache HBase
在本快速入門中,您將了解如何使用 Apache HBase Shell 來建立 HBase 資料表、插入資料,然後查詢資料表。
如果您沒有 Azure 訂用帳戶,請在開始前建立免費帳戶。
必要條件
Apache HBase 叢集。 請參閱建立叢集以建立 HDInsight 叢集。 請確定您選擇的是 [HBase] 叢集類型。
SSH 用戶端。 如需詳細資訊,請參閱使用 SSH 連線至 HDInsight (Apache Hadoop)。
建立資料表並操作資料
對大多數人而言,資料會以表格形式出現:
在 HBase (實作 Cloud BigTable) 中,相同的資料看起來如下:
您可以使用 SSH 來連線到 HBase 叢集,然後使用 Apache HBase Shell 來建立 HBase 資料表、插入資料及查詢資料。
使用
ssh
命令來連線至您的 HBase 叢集。 編輯以下命令並將CLUSTERNAME
取代為您叢集的名稱,然後輸入命令:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
使用
hbase shell
命令來啟動 HBase 互動式殼層。 在您的 SSH 連線中輸入下列命令:hbase shell
使用
create
命令來建立含兩個資料行系列的 HBase 資料表。 輸入下列命令:create 'Contacts', 'Personal', 'Office'
使用
list
命令來列出 HBase 中的所有資料表。 輸入下列命令:list
使用
put
命令來將值插入特定資料表中之指定資料列的指定資料行。 輸入下列命令:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
使用
scan
命令來掃描並傳回Contacts
資料表資料。 輸入下列命令:scan 'Contacts'
使用
get
命令來擷取資料列的內容。 輸入下列命令:get 'Contacts', '1000'
您會看到與使用
scan
命令類似的結果,因為只有一個資料列。使用
delete
命令來刪除資料表中資料格的值。 輸入下列命令:delete 'Contacts', '1000', 'Office:Address'
使用
disable
命令來停用資料表。 輸入下列命令:disable 'Contacts'
使用
drop
命令來將資料表從 HBase 卸除。 輸入下列命令:drop 'Contacts'
使用
exit
命令來停止 HBase 互動式殼層。 輸入下列命令:exit
如需 HBase 資料表結構描述的詳細資訊,請參閱 Apache HBase 結構描述設計簡介 \(英文\)。 如需其他 HBase 命令,請參閱 Apache HBase 參考指南 \(英文\)。
清除資源
完成此快速入門之後,您可以刪除叢集。 利用 HDInsight,您的資料會儲存在 Azure 儲存體中,以便您在未使用叢集時安全地進行刪除。 您也需支付 HDInsight 叢集的費用 (即使未使用)。 由於叢集費用是儲存體費用的許多倍,所以刪除未使用的叢集符合經濟效益。
若要刪除叢集,請參閱使用您的瀏覽器、PowerShell 或 Azure CLI 刪除 HDInsight 叢集。
下一步
在本快速入門中,您已了解如何使用 Apache HBase Shell 來建立 HBase 資料表、插入資料,然後查詢資料表。 若要深入了解儲存在 HBase 中的資料,下一篇文章將會說明如何使用 Apache Spark 來執行查詢。