Démarrage rapide : Exécuter des requêtes Apache HBase dans Azure HDInsight avec HBase Shell
Dans ce guide de démarrage rapide, vous allez apprendre à utiliser Apache HBase Shell pour créer une table HBase, insérer des données, puis interroger la table.
Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.
Prérequis
Un cluster Apache HBase. Consultez Créer un cluster pour créer un cluster HDInsight. Veillez à choisir le type de cluster HBase.
Un client SSH. Pour plus d’informations, consultez Se connecter à HDInsight (Apache Hadoop) à l’aide de SSH.
Créer une table et manipuler des données
Pour la plupart des utilisateurs, les données s’affichent sous la forme tabulaire :
Dans HBase (une implémentation de Cloud BigTable), certaines données ont l’aspect suivant :
Vous pouvez utiliser SSH pour vous connecter à des clusters HBase, puis utiliser Apache HBase Shell pour créer des tables HBase, et insérer et interroger des données.
Utilisez la commande
ssh
pour vous connecter à votre cluster HBase. Modifiez la commande ci-dessous en remplaçantCLUSTERNAME
par le nom de votre cluster, puis entrez la commande :ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
Utilisez la commande
hbase shell
pour démarrer l'interpréteur de commandes interactif HBase. Entrez la commande suivante dans votre connexion SSH :hbase shell
Utilisez la commande
create
pour créer une table HBase avec deux familles de colonnes. Entrez la commande suivante :create 'Contacts', 'Personal', 'Office'
Utilisez la commande
list
pour répertorier toutes les tables contenues dans HBase. Entrez la commande suivante :list
Utilisez la commande
put
pour insérer des valeurs dans une colonne et sur une ligne spécifiées d'une table particulière. Entrez la commande suivante :put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
Utilisez la commande
scan
pour analyser et renvoyer les données de la tableContacts
. Entrez la commande suivante :scan 'Contacts'
Utilisez la commande
get
pour extraire le contenu d'une ligne. Entrez la commande suivante :get 'Contacts', '1000'
Comme il n'y a qu'une seule ligne, vous obtenez des résultats semblables à ceux obtenus avec la commande
scan
.Utilisez la commande
delete
pour supprimer la valeur d'une cellule dans une table. Entrez la commande suivante :delete 'Contacts', '1000', 'Office:Address'
Utilisez la commande
disable
pour désactiver la table. Entrez la commande suivante :disable 'Contacts'
Utilisez la commande
drop
pour déposer une table de HBase. Entrez la commande suivante :drop 'Contacts'
Utilisez la commande
exit
pour arrêter l'interpréteur de commandes interactif HBase. Entrez la commande suivante :exit
Pour plus d'informations sur le schéma de la table HBase, consultez Introduction à la conception de schémas Apache HBase. Pour plus de commandes HBase, consultez le Guide de référence Apache HBase.
Nettoyer les ressources
Après avoir suivi ce guide de démarrage rapide, vous souhaiterez peut-être supprimer le cluster. Avec HDInsight, vos données sont stockées Azure Storage, pour que vous puissiez supprimer un cluster en toute sécurité s’il n’est pas en cours d’utilisation. Vous devez également payer pour un cluster HDInsight, même lorsque vous ne l’utilisez pas. Étant donné que les frais pour le cluster sont bien plus élevés que les frais de stockage, économique, mieux vaut supprimer les clusters lorsqu’ils ne sont pas utilisés.
Pour supprimer un cluster, consultez Supprimer un cluster HDInsight à l’aide de votre navigateur, de PowerShell ou d’Azure CLI.
Étapes suivantes
Dans ce guide de démarrage rapide, vous avez appris à utiliser Apache HBase Shell pour créer une table HBase, insérer des données, puis interroger la table. Pour en savoir plus sur les données stockées dans HBase, consultez l'article suivant qui explique comment exécuter des requêtes avec Apache Spark.