共用方式為


在 HDInsight 上設定 Apache Kafka 的儲存體和延展性

了解如何設定 HDInsight 上的 Apache Kafka 所使用的受控磁碟數目。

HDInsight 上的 Kafka 會在 HDInsight 叢集中使用虛擬機器的本機磁碟。 由於 Kafka 的 I/O 非常大量,因此會使用 Azure 受控磁碟來提供高輸送量,並提供每個節點更多儲存空間。 如果將傳統的虛擬硬碟 (VHD) 用於 Kafka,每個節點就會限制為 1 TB。 使用受控磁碟時,您可以利用多個磁碟在叢集中的每個節點達到 16 TB。

下圖提供 HDInsight 上的 Kafka 採用受控磁碟之前與 HDInsight 上的 Kafka 採用受控磁碟之間的比較:

具有受控磁碟架構的kafka。

設定受控磁碟:Azure 入口網站

  1. 請遵循建立 HDInsight 叢集中的步驟,了解使用入口網站建立叢集的一般步驟。 請勿完成入口網站建立程序。

  2. 從 [設定與價格] 區段中,使用 [節點數目] 欄位,以設定磁碟數目。

    注意

    受控磁碟的類型可以是標準 (HDD) 或進階 (SSD)。 進階磁碟會與 DS 和 GS 系列搭配使用。 所有其他的 VM 類型是使用標準磁碟。

    叢集大社區段,其中已醒目提示每個背景工作節點的磁碟。

設定受控磁碟:Resource Manager 範本

若要控制背景工作角色節點在 Kafka 叢集中所使用的磁碟數目,請使用下列區段的範本:

"dataDisksGroups": [
    {
        "disksPerNode": "[variables('disksPerWorkerNode')]"
    }
    ],

下一步

如需使用 HDInsight 上 Apache Kafka 的詳細資訊,請參閱下列文件: