AKS 上的 HDInsight - 常見問題
本文說明 AKS 上 Azure HDInsight 的一些常見問題。
重要
AKS 上的 Azure HDInsight 於 2025 年 1 月 31 日淘汰。 透過此公告 深入瞭解。
您必須將工作負載移轉至 Microsoft Fabric 或對等 Azure 產品,以避免突然終止工作負載。
重要
這項功能目前為預覽狀態。 Microsoft Azure 預覽版的補充使用規定 包含適用於 Beta 版、預覽版或尚未正式發行之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊上的 Azure HDInsight。 如有問題或功能建議,請提交要求 AskHDInsight,並關注我們以取得 Azure HDInsight 社群的更多更新。
一般
什麼是 AKS 上的 HDInsight?
AKS 上的 HDInsight 是新的 HDInsight 版本,可為企業就緒的受控叢集服務提供新興的開放原始碼分析專案,例如 Apache Flink(適用於串流)、Trino(適用於臨機作分析和 BI),以及 Apache Spark。 如需詳細資訊,請參閱 概觀。
AKS 上的 HDInsight 支援哪些叢集圖形?
在 AKS 上的 HDInsight 目前支援 Trino、Apache Flink 和 Apache Spark。 其他如 Kafka、Hive 等叢集類型已納入計畫中。
如何開始使用 AKS 上的 HDInsight?
若要開始使用,請瀏覽 Azure Marketplace,並在 AKS 服務上搜尋 Azure HDInsight,並參閱 開始使用。
目前在 VM 上運行的現有 HDInsight 和叢集會怎麼樣?
現有的 HDInsight (VM 上的 HDInsight)沒有任何變更。 所有現有的叢集都會繼續執行,而且您可以繼續建立及調整新的 HDInsight 叢集。
AKS 上的 HDInsight 支援哪個作業系統?
AKS 上的 HDInsight 是以 Mariner OS 為基礎。 如需詳細資訊,請參閱 OS 版本。
AKS 上有哪些區域可以使用 HDInsight?
如需支援的區域清單,請參閱 區域可用性。
在 AKS 叢集上部署 HDInsight 的成本為何?
如需有關定價的詳細資訊,請參閱 AKS 定價中的 HDInsight。
叢集管理
我可以同時執行多個叢集嗎?
是,您可以同時執行每個叢集池中所想要的數量的叢集。 不過,請確定您不是依訂用帳戶配額限制。 叢集集區中允許的節點數目上限為 250(公開預覽版)。
我可以在叢集上安裝或新增更多外掛程式/連結庫嗎?
是,您可以根據叢集圖形安裝自定義外掛程式和連結庫。
我可以透過 SSH 連線到叢集嗎?
是,您可以透過webssh透過 SSH 連線到叢集,然後直接從該處執行查詢並提交作業。
中繼存放區
我可以使用外部中繼存放區來連線到叢集嗎?
是,您可以使用外部中繼存放區。 不過,我們僅支援 Azure SQL Database 做為外部自定義中繼存放區。
我可以跨多個叢集共享中繼存放區嗎?
是的,您可以在 AKS 的多個 HDInsight 叢集中共用一個中繼資料庫。
支援的 Hive Metastore 版本是什麼?
Hive metastore 3.1.2 版
工作量
Trino
什麼是 Trino?
Trino 是開放原始碼同盟和分散式 SQL 查詢引擎,可讓您查詢位於不同數據源上的數據,而不需要移至中央數據倉儲。 您可以使用 ANSI SQL 查詢數據,而不需要學習新的語言。 如需詳細資訊,請參閱 Trino 概觀。
您支援哪些連接器?
AKS Trino 上的 HDInsight 支援多個連接器。 如需詳細資訊,請參閱此 Trino 連接器清單。 我們會在開放原始碼版本中提供新的連接器時,繼續新增連接器。
我可以將目錄新增至現有的叢集嗎?
是,您可以將支援的目錄新增至現有的叢集。 如需詳細資訊,請參閱 將目錄新增至現有的叢集。
Apache Flink
什麼是 Apache Flink?
Apache Flink 是一個最先進的開放原始碼分析引擎,可用於串流處理,以及針對未系結和限定數據流執行具狀態計算。 它可以以記憶體速度進行運算,且適用於任何規模。 AKS 上的 HDInsight 上的 Flink 提供受控開放原始碼 Apache Flink。 如需詳細資訊,請參閱 Flink 概觀。
您是否支援在 Apache Flink 中使用工作階段模式和應用程式模式?
在 AKS 上的 HDInsight 中,Flink 目前支援會話模式叢集。
什麼是狀態後端管理,以及如何在 AKS 上的 HDInsight 中完成?
後端會決定儲存狀態的位置。 啟用檢查點時,狀態會持續保存至檢查點,以防範數據遺失,並有效地進行復原。 狀態在內部呈現的方式,以及檢查點上保存狀態的方式和位置取決於所選的狀態後端。 如需詳細資訊,請參閱 Flink 概觀
Apache Spark
什麼是 Apache Spark?
Apache Spark 是數據處理架構,可在大型數據集上快速執行處理工作,也可以自行或與其他分散式運算工具一起,將數據處理工作分散到多部計算機上。
Spark 支援哪些語言 API?
AKS 上的 Azure HDInsight 支援 Python 和 Scala。
AKS Spark 上的 HDInsight 是否支援外部中繼存放區?
AKS 上的 HDInsight 支援外部中繼存放區連線。 目前僅支持作為外部中繼存放區的 Azure SQL DB。
在 AKS Spark 上提交 HDInsight 中作業的各種方式為何?
您可以使用 Jupyter Notebook、Zeppelin Notebook、SDK 和叢集終端,在 AKS Spark 上提交 HDInsight 上的作業。 如需詳細資訊,請參閱在 AKS 上 在 HDInsight 的 Spark 叢集上提交和管理作業