共用方式為


HDInsight 在 AKS 上有什麼新功能? (預覽)

重要

AKS 上的 Azure HDInsight 於 2025 年 1 月 31 日淘汰。 透過此公告 深入瞭解

您必須將工作負載移轉至 Microsoft Fabric 或對等 Azure 產品,以避免突然終止工作負載。

重要

這項功能目前為預覽狀態。 Microsoft Azure 預覽版的補充使用規定 包含適用於 Beta 版、預覽版或尚未正式發行之 Azure 功能的更合法條款。 如需此特定預覽的相關資訊,請參閱 Azure HDInsight 在 AKS 上的預覽資訊。 如有疑問或功能建議,請在 AskHDInsight 提交請求,並關注我們以獲取 Azure HDInsight 社群的更多更新。

在 AKS 上的 HDInsight 平台中,所有叢集的管理和操作都本地支援個體叢集在 Azure 入口網站上的 服務管理功能

在 AKS 上的 HDInsight 中,引進了兩個新的概念:

  • 叢集集區 用來群組和管理叢集。
  • 叢集 用於開放原始碼計算,它們裝載在叢集集區內。

叢集集區

AKS 上的 HDInsight 會在 Azure Kubernetes Service (AKS) 上執行。 最上層資源是叢集集區,並管理在相同 AKS 叢集上執行的所有叢集。 當您建立叢集集區時,會同時建立基礎 AKS 叢集,以裝載集區中的所有叢集。 叢集集區是叢集的邏輯群組,可協助跨多個叢集類型建立健全的互作性,並允許企業在相同的虛擬網路中擁有叢集。 叢集集區可快速且符合成本效益地存取隨選和大規模建立的所有叢集類型。一個叢集集區對應至 AKS 基礎結構中的一個叢集。

集群

叢集是獨立的開放原始碼計算工作負載,例如 Apache Spark、Apache Flink 和 Trino,可在短短幾分鐘內快速建立,僅需預設組態和幾次點擊。 雖然在相同的叢集集集區上執行,但每個叢集可以有自己的設定,例如叢集類型、版本、節點 VM 大小、節點計數。 叢集會以自己的 DNS 和端點,在個別的計算資源上執行。

目前處於預覽狀態的功能

下表清單顯示目前處於預覽狀態的 AKS 上的 HDInsight 功能。 預覽功能會依字母順序排序。

面積 特徵
基礎 使用入口網站建立集區與叢集,支援 Web 安全殼層(ssh),能夠在叢集建立期間選擇背景工作節點數目
存儲 ADLS Gen2 儲存體 支援
中繼存放區 TrinoSparkFlink的外部中繼存放區支援,與 HDInsight 整合
安全 提供支援 ARM RBAC 的選項;提供支援 MSI 型驗證的選項;提供 叢集存取權的選項 給其他使用者。
記錄和監視 Azure 記錄分析中的記錄匯總,適用於伺服器記錄、叢集和服務計量,透過 Managed Prometheus 和 Grafana,支援 azure 監視器中的伺服器計量、服務狀態頁面來監視 服務健康情況
自動縮放 以載入為基礎的 自動調整,及以排程為基礎的 自動調整
自訂和設定叢集 支援叢集建立期間 腳本動作、支援叢集建立後 連結庫管理服務設定
Trino 支援 Trino 目錄Trino CLI 支援DBeaver 查詢提交支援、 在 Trino 儀表板中新增或移除 連接器、支援 記錄查詢 事件、掃描查詢統計數據的支援、Trino 儀錶板中任何 連接器 支援、Trino 儀錶板 監視查詢的支援、 查詢快取、與 Power BI 整合、與 Apache Superset整合、Redash、支援多個 連接器
Flink 支援 Flink 原生 Web UI、Flink 支援 HMS DStream、使用 REST API 和 Azure 入口網站將作業提交至叢集、透過 Flink CLI 封裝為 JAR 檔案的程式、支持持續性 Savepoint、支援更新作業執行時設定選項、聯機至多個 Azure 服務: Azure Cosmos DBAzure DatabricksAzure 數據總管Azure 事件中樞Azure IoT 中樞Azure PipelinesAzure Data Factory 工作流程協調流程管理員HDInsight Kafka使用 Flink CLI 將作業提交至叢集,並使用 Flink CDC
火花 Jupyter Notebook、支援 Delta Lake 2.0、Zeppelin 支援、支援 ATS、Yarn 歷程記錄伺服器介面支援、使用 SSH 提交作業、使用 SDK 提交作業,以及 Machine Learning Notebook

功能藍圖

特徵 預估發行時程表 地位
自動調整 - 以負載為基礎的 - Trino 2024年第一季度 完成
針對 Spark 隨機顯示感知負載自動調整 2024年第二季度 進行中
就地升級 2024年第二季度 完成
保留實例支援 2024年第二季 進行中
中繼存放區的 MSI 型驗證 (SQL) 2024年第1季 進行中
Spark 3.4 2024年第二季 進行中
Trino 426 2024年第一季 完成
Ranger 用於 RBAC 2024年第二季 進行中
應用程式模式對 Flink 的支援 2024年第一季度 完成
Flink 1.17 2024 年第一季 完成
Spark ACID 支援 2024年第一季 進行中
適用於 Headnode、SSH 的可設定 SKU 2024 年第 2 季 進行中
Flink SQL 閘道支援 2024年第一季 完成
AKS 上的 HDInsight 私有叢集 2024 年第一季度 完成
Spark SQL 的 Ranger 支援功能 2024年第四季度 進行中
儲存層上的 Ranger ACL 2024年第4季 進行中
支援 One Lake 作為主要容器 2024年第2季 進行中