Поделиться через


Что нового в HDInsight на AKS? (предварительная версия)

Важный

Azure HDInsight на AKS снято с эксплуатации 31 января 2025 г. Узнайте больше об этом объявлении.

Необходимо перенести рабочие нагрузки в Microsoft Fabric или эквивалентный продукт Azure, чтобы избежать резкого завершения рабочих нагрузок.

Важный

Эта функция сейчас доступна в предварительной версии. Дополнительные условия использования для предварительных версий Microsoft Azure включают дополнительные юридические термины, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или в противном случае еще не выпущены в общую доступность. Сведения об этой конкретной предварительной версии см. в Azure HDInsight в предварительной версии AKS. Для вопросов или предложений по функциям, пожалуйста, отправьте запрос на AskHDInsight с подробностями и подписывайтесь на обновления в Azure HDInsight Community.

В HDInsight на AKS все операции по управлению кластерами имеют встроенную поддержку управления службами на портале Azure для каждого отдельного кластера.

В HDInsight на AKS были введены два новых понятия:

  • пулы кластеров используются для группировки кластеров и управления ими.
  • кластеры используются для вычислений с открытым кодом, они размещаются в пуле кластеров.

Пулы кластеров

HDInsight на базе AKS работает в службе Azure Kubernetes (AKS). Ресурс верхнего уровня — это пул кластеров и управляет всеми кластерами, работающими в одном кластере AKS. При создании пула кластеров базовый кластер AKS создается одновременно для размещения всех кластеров в пуле. Пулы кластеров — это логическая группа кластеров, которая помогает создавать надежную совместимость между несколькими типами кластеров и позволяет предприятиям иметь кластеры в одной виртуальной сети. Пулы кластеров обеспечивают быстрый и экономичный доступ ко всем типам кластеров, созданным по требованию и в масштабе. Один пул кластеров соответствует одному кластеру в инфраструктуре AKS.

Кластеры

Кластеры — это отдельные вычислительные рабочие нагрузки с открытым исходным кодом, такие как Apache Spark, Apache Flink и Trino, которые можно быстро создавать в течение нескольких минут с предварительно настроенными конфигурациями и несколькими щелчками мыши. Хотя он работает в одном пуле кластеров, каждый кластер может иметь собственные конфигурации, такие как тип кластера, версия, размер виртуальной машины узла, количество узлов. Кластеры выполняются на отдельных вычислительных ресурсах с собственными DNS и конечными точками.

Функции в настоящее время в предварительной версии

В следующей таблице показаны функции HDInsight в AKS, которые в настоящее время находятся в предварительной версии. Предварительные версии функций отсортированы по алфавиту.

Площадь Функции
Основы создание пула и кластеров с помощью портала, поддержки веб-безопасной оболочки (ssh), возможность выбора количества рабочих узлов во время создания кластера
Хранение Поддержка хранения ADLS Gen2
Хранилище метаданных Поддержка внешнего хранилища метаданных для Trino, Spark и Flink, интеграция с HDInsight
Безопасность Поддержка ARM RBAC, поддержка аутентификации на основе MSI, возможность предоставления пользователям доступа к кластеру
Ведение журнала и мониторинг Агрегирование журналов в Azure log analyticsдля журналов серверов, метрик кластеров и служб с помощью Managed Prometheus и Grafana, поддержка метрик серверов в Azure Monitor, страница "Состояние службы" для мониторинга работоспособности службы
Автомасштабирование Автомасштабирование по нагрузкеи автомасштабирование на основе расписания
Персонализация и конфигурация кластеров Поддержка действий скриптов во время создания кластера, поддержка управления библиотекой , настройка параметров службы после создания кластера.
Трино Поддержка каталогов Trino, поддержка интерфейса командной строки Trino , поддержка DBeaver для отправки запросов; добавление или удаление плагинов и соединителей , поддержка журналирования событий , поддержка статистики сканирования запросов для любого соединителя на панели управления Trino, поддержка панели Trino для мониторинга запросов, кэширование запросов , интеграция с Power BI, интеграция с Apache Superset , Redash, поддержка нескольких соединителей .
Flink Поддержка собственного веб-интерфейса Flink, поддержка Flink с помощью HMS для DStream, отправка заданий в кластер с помощью REST API и портала Azure, запуск программ, упакованных в виде JAR-файлов, с помощью Flink CLI, поддержка постоянных точек сохранения, поддержка обновления параметров конфигурации при выполнении задания, подключение к нескольким службам Azure: Azure Cosmos DB, Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Диспетчер оркестрации рабочих процессов Azure Data Factory, HDInsight Kafka, отправка заданий в кластер с помощью Flink CLI и CDC с Flink.
Искра Jupyter Notebook, поддержка Delta lake 2.0, поддержка Zeppelin, поддержка ATS, поддержка интерфейса сервера журнала Yarn, отправка заданий с помощью SSH, отправка заданий с помощью пакета SDK и записной книжки машинного обучения

План разработки функций

Особенность Предполагаемая временная шкала выпуска Статус
Автомасштабирование — основанное на нагрузке — Trino первый квартал 2024 года Завершено
Автоматическое масштабирование с учетом нагрузки и перестановок для Spark 2-й квартал 2024 года В процессе
обновление без переустановки второй квартал 2024 года Завершено
Поддержка зарезервированного экземпляра 2-й квартал 2024 года В процессе
Проверка подлинности на основе MSI для хранилища метаданных (SQL) 1-й квартал 2024 года В процессе
Spark 3.4 2-й квартал 2024 года В процессе
Трино 426 1 квартал 2024 года Завершено
Ranger для RBAC 2 квартал 2024 года В процессе
Поддержка режима приложения для Flink 1-й квартал 2024 года Завершено
Flink 1.17 первый квартал 2024 года Завершено
Поддержка Spark ACID 1 квартал 2024 года В процессе
Настраиваемые номера SKU для Headnode, SSH 2 квартал 2024 В процессе
Поддержка шлюза SQL Flink 1-й квартал 2024 года Завершено
Частные кластеры для HDInsight на AKS 1 квартал 2024 Завершено
Поддержка Ranger для Spark SQL 4-й квартал 2024 года В процессе
Списки управления доступом Ranger на уровне хранилища 4-й квартал 2024 года В процессе
Поддержка One Lake в качестве основного контейнера 2-й квартал 2024 года В процессе