Краткое руководство. Выполнение запросов Apache HBase в Azure HDInsight с помощью HBase Shell
В этом кратком руководстве описано, как с помощью Apache HBase Shell создать таблицу HBase, вставить данные и затем выполнить к ней запрос.
Если у вас нет подписки Azure, создайте бесплатную учетную запись, прежде чем приступить к работе.
Необходимые компоненты
Кластер Apache HBase. Чтобы создать кластер HDInsight, обратитесь к разделу Создание кластера Hadoop. Убедитесь, что выбран тип кластера HBase.
Клиент SSH. Дополнительные сведения см. в руководстве по подключению к HDInsight (Apache Hadoop) с помощью SSH.
Создание таблицы и обработка данных
Для большинства пользователей данные отображаются в табличном формате:
В HBase (реализация Cloud BigTable) те же данные выглядят следующим образом:
Для подключения к кластерам HBase можно использовать протокол SSH, а для создания таблиц HBase, вставки данных и создания запросов к данным — Apache HBase Shell.
С помощью команды
ssh
подключитесь к кластеру HBase. Измените приведенную ниже команду, заменивCLUSTERNAME
именем своего кластера, а затем введите команду:ssh sshuser@CLUSTERNAME-ssh.azurehdinsight.net
С помощью команды
hbase shell
запустите интерактивную оболочку HBase. В строку SSH-подключения введите следующую команду:hbase shell
С помощью команды
create
создайте таблицу HBase с двумя семействами столбцов. Введите следующую команду:create 'Contacts', 'Personal', 'Office'
С помощью команды
list
выведите список всех таблиц HBase. Введите следующую команду:list
С помощью команды
put
вставьте значения в указанный столбец строки в определенной таблице. Введите следующую команду:put 'Contacts', '1000', 'Personal:Name', 'John Dole' put 'Contacts', '1000', 'Personal:Phone', '1-425-000-0001' put 'Contacts', '1000', 'Office:Phone', '1-425-000-0002' put 'Contacts', '1000', 'Office:Address', '1111 San Gabriel Dr.'
С помощью команды
scan
выполните сканирование данных таблицыContacts
и верните их. Введите следующую команду:scan 'Contacts'
С помощью команды
get
получите содержимое строки. Введите следующую команду:get 'Contacts', '1000'
Вы увидите те же результаты, что и при использовании команды
scan
, так как в таблице есть только одна строка.С помощью команды
delete
удалите значение ячейки в таблице. Введите следующую команду:delete 'Contacts', '1000', 'Office:Address'
С помощью команды
disable
отключите таблицу. Введите следующую команду:disable 'Contacts'
С помощью команды
drop
удалите таблицу из HBase. Введите следующую команду:drop 'Contacts'
С помощью команды
exit
остановите интерактивную оболочку HBase. Введите следующую команду:exit
Дополнительные сведения о схеме таблицы HBase см. в этой статье. Дополнительные команды HBase см. в справочнике по Apache HBase.
Очистка ресурсов
После завершения работы с этим кратким руководством кластер можно удалить. В случае с HDInsight ваши данные хранятся в службе хранилища Azure, что позволяет безопасно удалить неиспользуемый кластер. Плата за кластеры HDInsight взимается, даже когда они не используются. Поскольку стоимость кластера во много раз превышает стоимость хранилища, экономически целесообразно удалять неиспользуемые кластеры.
Инструкции по удалению кластера см. в статье Delete an HDInsight cluster using your browser, PowerShell, or the Azure CLI (Удаление кластера HDInsight с помощью браузера, PowerShell или Azure CLI).
Следующие шаги
Из этого краткого руководства вы узнали, как с помощью Apache HBase Shell создать таблицу HBase, вставить данные и затем выполнить к ней запрос. Дополнительные сведения о хранящихся в Hive данных см. в следующей статье, в которой показано, как выполнять запросы с помощью Apache Spark.