Поделиться через


Общие сведения об интерактивном запросе в Azure HDInsight

Interactive Query (также называется Apache Hive LLAP или Low Latency Analytical Processing) — это тип кластера Azure HDInsight. Interactive Query поддерживает кэширование в памяти, благодаря чему запросы Apache Hive становятся более быстрыми и интерактивными. Клиенты используют интерактивный запрос для сверхбыстрого запроса данных, хранящихся в службе хранилища Azure и Azure Data Lake Storage. Интерактивный запрос упрощает разработчикам и специалистам по обработке и анализу данных работу с большими данными с помощью предпочитаемых средств бизнес-аналитики. Интерактивный запрос HDInsight поддерживает несколько инструментов для простого доступа к большим данным.

Кластер Interactive Query отличается от кластера Apache Hadoop. Он содержит только сервис Hive.

Получить доступ к службе Hive в кластере Interactive Query можно только с помощью представления Apache Ambari Hive, Beeline и драйвера Microsoft Hive ODBC. Эта служба недоступна через консоль Hive, Templeton, классический интерфейс командной строки Azure и Azure PowerShell.

Создание кластера интерактивных запросов

Сведения о создании кластера HDInsight см. в статье Создание кластеров Apache Hadoop в HDInsight. Выберите тип кластера Interactive Query.

Внимание

Минимальный размер головного узла для кластеров Interactive Query — это Standard_D13_v2. Дополнительные сведения см. в диаграмме размера виртуальных машин Azure.

Выполнение запросов Apache Hive из Interactive Query

Есть несколько способов выполнять запросы Hive:

Метод Описание
Microsoft Power BI Ознакомьтесь со статьей о визуализации данных интерактивного запроса Apache Hive с помощью Power BI в Azure HDInsight и о визуализации больших данных с помощью Power BI в Azure HDInsight.
Visual Studio См. Подключение к Azure HDInsight и выполнение запросов Apache Hive с использованием Data Lake Tools для Visual Studio.
Visual Studio Code Ознакомьтесь с использованием Visual Studio Code для Apache Hive, LLAP или pySpark.
Представление Ambari Apache Hive Ознакомьтесь со статьей Использование Apache Hive с Apache Hadoop в HDInsight. Hive View недоступно для HDInsight 4.0.
Apache Beeline Ознакомьтесь со статьей Использование Apache Hive с Apache Hadoop в HDInsight с Beeline. Вы можете использовать Beeline на головном узле или пустом граничном узле. Рекомендуем использовать Beeline на незагруженном пограничном узле. Сведения о создании кластера HDInsight с помощью пустого пограничного узла см. в статье "Использование пустых пограничных узлов в HDInsight".
Hive ODBC Ознакомьтесь со статьей Подключение Excel к Apache Hadoop с помощью драйвера Microsoft Hive ODBC.

Чтобы найти строку подключения для Java Database Connectivity (JDBC):

  1. В веб-браузере перейдите на страницу https://CLUSTERNAME.azurehdinsight.net/#/main/services/HIVE/summary, где CLUSTERNAME — это имя вашего кластера.

  2. Чтобы скопировать URL-адрес, щелкните значок буфера обмена:

    HDInsight Hadoop Interactive Query LLAP JDBC.

Следующие шаги