Guia de início rápido: consultar o Apache HBase no Azure HDInsight usando o Shell do HBase
Neste início rápido, você aprenderá a usar o Shell do Apache HBase para criar uma tabela do HBase, inserir dados e, em seguida, consultar a tabela.
Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.
Pré-requisitos
Um cluster do Apache HBase. Confira Criar cluster para criar um cluster HDInsight. Escolha o tipo de cluster HBase.
Um cliente SSH. Para saber mais, confira Conectar-se ao HDInsight (Apache Hadoop) usando SSH.
Criar uma tabela e manipular dados
Para a maioria das pessoas, os dados aparecem no formato de tabela:
No HBase (uma implementação do Cloud BigTable), os mesmos dados se parecem com:
Você pode usar o SSH para se conectar aos clusters do HBase e, em seguida, usar o Shell do Apache HBase para criar tabelas do HBase, inserir dados e consultar dados.
Use o comando
ssh
para se conectar ao cluster HBase. Edite o comando abaixo substituindoCLUSTERNAME
pelo nome do cluster e, em seguida, digite o comando:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Use o comando
hbase shell
para iniciar o shell interativo do HBase. Digite o seguinte comando em sua conexão de SSH:hbase shell
Use o comando
create
para criar uma tabela do HBase com famílias de duas colunas. Insira o seguinte comando:create 'Contacts', 'Personal', 'Office'
Use o comando
list
para listar todas as tabelas no HBase. Insira o seguinte comando:list
Use o comando
put
para inserir valores em uma coluna e linha especificadas em uma determinada tabela. Digite o seguinte comando:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Use o comando
scan
para verificar e retornar os dados da tabelaContacts
. Insira o seguinte comando:scan 'Contacts'
Use o comando
get
para buscar o conteúdo de uma linha. Insira o seguinte comando:get 'Contacts', '1000'
Você vê resultados semelhantes usando o comando
scan
porque há apenas uma linha de comando.Use o comando
delete
para excluir um valor de célula na tabela. Digite o seguinte comando:delete 'Contacts', '1000', 'Office:Address'
Use o comando
disable
para desabilitar a tabela. Digite o seguinte comando:disable 'Contacts'
Use o comando
drop
para remover uma tabela do HBase. Digite o seguinte comando:drop 'Contacts'
Use o comando
exit
para interromper o shell interativo do HBase. Insira o seguinte comando:exit
Para saber mais sobre o esquema da tabela HBase, confira Introdução ao projeto de esquema do Apache HBase. Para obter mais comandos HBase, confira Guia de referência do Apache HBase.
Limpar os recursos
Após concluir o início rápido, poderá ser conveniente excluir o cluster. Com o HDInsight, seus dados são armazenados no Armazenamento do Azure, assim você poderá excluir, com segurança, um cluster quando ele não estiver em uso. Você também é cobrado por um cluster HDInsight, mesmo quando ele não está em uso. Como os encargos para o cluster são muitas vezes maiores do que os encargos para armazenamento, faz sentido, do ponto de vista econômico, excluir os clusters quando não estiverem em uso.
Para excluir um cluster, confira Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI (Excluir um cluster HDInsight usando o navegador, o PowerShell ou a CLI do Azure).
Próximas etapas
Neste início rápido, você aprendeu como usar o Shell do Apache HBase para criar uma tabela do HBase, inserir dados e, em seguida, consultar a tabela. Para saber mais sobre os dados armazenados no HBase, o próximo artigo mostrará como executar consultas com o Apache Spark.