共用方式為


AKS 上的 HDInsight - 常見問題

本文說明 AKS 上 Azure HDInsight 的一些常見問題。

重要

AKS 上的 Azure HDInsight 於 2025 年 1 月 31 日淘汰。 透過此公告 深入瞭解

您必須將工作負載移轉至 Microsoft Fabric 或對等 Azure 產品,以避免突然終止工作負載。

重要

這項功能目前為預覽狀態。 Microsoft Azure 預覽版的補充使用規定 包含適用於 Beta 版、預覽版或尚未正式發行之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊上的 Azure HDInsight。 如有問題或功能建議,請提交要求 AskHDInsight,並關注我們以取得 Azure HDInsight 社群的更多更新。

一般

  • 什麼是 AKS 上的 HDInsight?

    AKS 上的 HDInsight 是新的 HDInsight 版本,可為企業就緒的受控叢集服務提供新興的開放原始碼分析專案,例如 Apache Flink(適用於串流)、Trino(適用於臨機作分析和 BI),以及 Apache Spark。 如需詳細資訊,請參閱 概觀

  • AKS 上的 HDInsight 支援哪些叢集圖形?

    在 AKS 上的 HDInsight 目前支援 Trino、Apache Flink 和 Apache Spark。 其他如 Kafka、Hive 等叢集類型已納入計畫中。

  • 如何開始使用 AKS 上的 HDInsight?

    若要開始使用,請瀏覽 Azure Marketplace,並在 AKS 服務上搜尋 Azure HDInsight,並參閱 開始使用

  • 目前在 VM 上運行的現有 HDInsight 和叢集會怎麼樣?

    現有的 HDInsight (VM 上的 HDInsight)沒有任何變更。 所有現有的叢集都會繼續執行,而且您可以繼續建立及調整新的 HDInsight 叢集。

  • AKS 上的 HDInsight 支援哪個作業系統?

    AKS 上的 HDInsight 是以 Mariner OS 為基礎。 如需詳細資訊,請參閱 OS 版本

  • AKS 上有哪些區域可以使用 HDInsight?

    如需支援的區域清單,請參閱 區域可用性

  • 在 AKS 叢集上部署 HDInsight 的成本為何?

    如需有關定價的詳細資訊,請參閱 AKS 定價中的 HDInsight。

叢集管理

  • 我可以同時執行多個叢集嗎?

    是,您可以同時執行每個叢集池中所想要的數量的叢集。 不過,請確定您不是依訂用帳戶配額限制。 叢集集區中允許的節點數目上限為 250(公開預覽版)。

  • 我可以在叢集上安裝或新增更多外掛程式/連結庫嗎?

    是,您可以根據叢集圖形安裝自定義外掛程式和連結庫。

  • 我可以透過 SSH 連線到叢集嗎?

    是,您可以透過webssh透過 SSH 連線到叢集,然後直接從該處執行查詢並提交作業。

中繼存放區

  • 我可以使用外部中繼存放區來連線到叢集嗎?

    是,您可以使用外部中繼存放區。 不過,我們僅支援 Azure SQL Database 做為外部自定義中繼存放區。

  • 我可以跨多個叢集共享中繼存放區嗎?

    是的,您可以在 AKS 的多個 HDInsight 叢集中共用一個中繼資料庫。

  • 支援的 Hive Metastore 版本是什麼?

    Hive metastore 3.1.2 版

工作量

Trino

  • 什麼是 Trino?

    Trino 是開放原始碼同盟和分散式 SQL 查詢引擎,可讓您查詢位於不同數據源上的數據,而不需要移至中央數據倉儲。 您可以使用 ANSI SQL 查詢數據,而不需要學習新的語言。 如需詳細資訊,請參閱 Trino 概觀

  • 您支援哪些連接器?

    AKS Trino 上的 HDInsight 支援多個連接器。 如需詳細資訊,請參閱此 Trino 連接器清單。 我們會在開放原始碼版本中提供新的連接器時,繼續新增連接器。

  • 我可以將目錄新增至現有的叢集嗎?

    是,您可以將支援的目錄新增至現有的叢集。 如需詳細資訊,請參閱 將目錄新增至現有的叢集

  • 什麼是 Apache Flink?

    Apache Flink 是一個最先進的開放原始碼分析引擎,可用於串流處理,以及針對未系結和限定數據流執行具狀態計算。 它可以以記憶體速度進行運算,且適用於任何規模。 AKS 上的 HDInsight 上的 Flink 提供受控開放原始碼 Apache Flink。 如需詳細資訊,請參閱 Flink 概觀

  • 您是否支援在 Apache Flink 中使用工作階段模式和應用程式模式?

    在 AKS 上的 HDInsight 中,Flink 目前支援會話模式叢集。

  • 什麼是狀態後端管理,以及如何在 AKS 上的 HDInsight 中完成?

    後端會決定儲存狀態的位置。 啟用檢查點時,狀態會持續保存至檢查點,以防範數據遺失,並有效地進行復原。 狀態在內部呈現的方式,以及檢查點上保存狀態的方式和位置取決於所選的狀態後端。 如需詳細資訊,請參閱 Flink 概觀

Apache Spark

  • 什麼是 Apache Spark?

    Apache Spark 是數據處理架構,可在大型數據集上快速執行處理工作,也可以自行或與其他分散式運算工具一起,將數據處理工作分散到多部計算機上。

  • Spark 支援哪些語言 API?

    AKS 上的 Azure HDInsight 支援 Python 和 Scala。

  • AKS Spark 上的 HDInsight 是否支援外部中繼存放區?

    AKS 上的 HDInsight 支援外部中繼存放區連線。 目前僅支持作為外部中繼存放區的 Azure SQL DB。

  • 在 AKS Spark 上提交 HDInsight 中作業的各種方式為何?

    您可以使用 Jupyter Notebook、Zeppelin Notebook、SDK 和叢集終端,在 AKS Spark 上提交 HDInsight 上的作業。 如需詳細資訊,請參閱在 AKS 在 HDInsight 的 Spark 叢集上提交和管理作業