共用方式為


使用 Azure 入口網站在 HDInsight 中建立 Linux 型叢集

Azure 入口網站是 Web 架構的管理工具,可用來管理裝載於 Microsoft Azure 雲端中的服務和資源。 在本文中,您會了解如何使用入口網站來建立 Linux 型 Azure HDInsight 叢集。 您可以從建立 HDInsight 叢集取得其他詳細資料。

警告

不論使用與否,HDInsight 叢集都是按分鐘計費。 請務必在使用完叢集後將它刪除。 請參閱如何刪除 HDInsight 叢集

Azure 入口網站會公開大部分的叢集屬性。 藉由使用 Azure Resource Manager 範本,您可以隱藏許多詳細資料。 如需詳細資訊,請參閱使用 Resource Manager 範本在 HDInsight 中建立 Apache Hadoop 叢集

如尚未擁有 Azure 訂用帳戶,請在開始之前先建立免費帳戶

建立叢集

注意

需要安全傳輸的功能會透過安全連線,強制執行您帳戶的所有要求。 只有 HDInsight 叢集 3.6 版或更新版本支援這項功能。 如需詳細資訊,請參閱在 Azure HDInsight 中使用安全傳輸儲存體帳戶建立 Apache Hadoop 叢集

  1. 登入 Azure 入口網站

  2. 從頂部功能表選取 [+建立資源]

    在 Azure 入口網站 中建立新的叢集。

  3. 選取 [分析]>[Azure HDInsight] 以移至 [建立 HDInsight 叢集] 頁面。

基本概念

顯示 HDInsight 4.0 建立叢集基本概念的螢幕快照。

在 [基本資料] 索引標籤中提供下列資訊:

屬性 描述
訂用帳戶 從下拉式清單中,選取用於此叢集的 Azure 訂用帳戶。
資源群組 從下拉式清單中選取現有資源群組,或選取 [新建]。
叢集名稱 輸入全域唯一名稱。
區域 從下拉式清單中,選取要在其中建立叢集的區域。
可用性區域 (選擇性) 指定要部署叢集的可用性區域。
叢集類型 按一下 [選取叢集類型],以開啟清單。 從清單中,選取想要的叢集類型。 HDInsight 叢集具有不同的類型。 它們與調整叢集時所針對的工作負載或技術對應。 目前沒有任何支援的方法可建立結合多個類型的叢集。
版本 從下拉式清單中選取 [版本]。 如果您不知道要選擇哪一個項目,請使用預設版本。 如需詳細資訊,請參閱 HDInsight 叢集版本
叢集登入使用者名稱 提供使用者名稱,預設值為 admin
叢集登入密碼 請提供密碼。
確認叢集登入密碼 重新輸入密碼
安全殼層 (SSH) 使用者名稱 提供使用者名稱,預設值為 sshuser
使用 SSH 的叢集登入密碼 如果您想要與稍早指定的系統管理員密碼相同的 SSH 密碼,請選取 Use cluster login password for SSH 複選框。 如果不要,請提供 [密碼] 或 [公開金鑰]來驗證 SSH 使用者。 我們建議使用公開金鑰。 選擇底部的 [選取] 以儲存認證設定。 如需詳細資訊,請參閱使用 SSH 連線到 HDInsight (Apache Hadoop)

選取 [下一步: 儲存體 >>] 以前進至下一個索引標籤。

儲存體

警告

從 2020 年 6 月 15 日開始,客戶將無法使用 HDInsight 來建立新的服務主體。 請參閱使用 Microsoft Entra ID 建立服務主體和憑證

HDInsight 會建立叢集記憶體。

主要儲存體

從 [主要儲存體類型] 的下拉式清單中,選取您的預設儲存體類型。 稍後要完成的欄位會根據您的選擇而不同。 針對 [Azure 儲存體]

  1. 針對 [選取方法],選擇 [從清單中選取] 或 [使用存取金鑰]

    • 針對 [從清單中選取],從下拉式清單中選取您的 [主要儲存體帳戶],或選取 [ 建立新項目]
    • 針對 [使用存取金鑰],輸入您的 [儲存體帳戶名稱]。 然後提供 [存取金鑰]
  2. 針對 [容器],接受預設值,或輸入新的值。

其他 Azure 儲存體

選用:針對其他叢集儲存體,選取 [新增 Azure 儲存體]。 不支援使用與 HDInsight 叢集位在不同區域的額外儲存體帳戶。

中繼存放區設定

選用:指定現有 SQL Database,以儲存叢集外部的 Apache Hive、Apache Oozie 和 Apache Ambari 中繼資料。 用於中繼存放區的 Azure SQL Database 必須允許連線至其他 Azure 服務 (包括 Azure HDInsight)。 當您建立中繼存放區時,請勿使用包含破折號或連字號的資料庫名稱。 這些字元可能會導致叢集建立程序失敗。

重要

針對支援中繼存放區的叢集圖形,預設中繼存放區會提供具有「基本第 5 層 DTU 限制 (無法升級)」的 Azure SQL Database! 適用於基本測試用途。 針對大型或生產工作負載,建議您移轉至外部中繼存放區。

選取 [下一步: 安全性 + 網路 >>] 以前進至下一個索引標籤。

安全性 + 網路

HDInsight 會建立叢集安全性網路。

從 [安全性 + 網路] 索引標籤中,提供下列資訊:

屬性 說明
企業安全性套件 選用:選取此核取方塊,以使用 [企業安全性套件]。 如需詳細資訊,請參閱使用 Microsoft Entra Domain Services 設定具有企業安全性套件的 HDInsight 叢集
TLS 選用:從下拉式清單中,選取 TLS 版本。 如需詳細資訊,請參閱傳輸層安全性
虛擬網路 選用:從下拉式清單中,選取現有虛擬網路和子網路。 如需詳細資訊,請參閱規劃 Azure HDInsight 叢集的虛擬網路部署。 此文章包含虛擬網路的特定設定需求。
磁碟加密設定 選用:選取此核取方塊,以使用加密。 如需詳細資訊,請參閱客戶管理的金鑰磁碟加密
Kafka REST Proxy 此設定僅適用於叢集類型 Kafka。 如需詳細資訊,請參閱使用 REST Proxy
身分識別 選用:從下拉式清單中,選取現有使用者指派的服務身分識別。 如需詳細資訊,請參閱 Azure HDInsight 中的受控身分識別

選取 [下一步: 設定 + 定價 >>] 以前進至下一個索引標籤。

設定 + 定價

HDInsight 建立叢集組態。

從 [設定 + 定價] 索引標籤中,提供下列資訊:

屬性 說明
+ 新增應用程式 選用:選取您想要的任何應用程式。 Microsoft、獨立軟體廠商 (ISV) 或您可以開發這些應用程式。 如需詳細資訊,請參閱在叢集建立期間安裝應用程式
節點大小 選用:選取不同大小的節點。
節點數目 選用:輸入所指定節點類型的節點數目。 如果您打算使用 32 個以上的背景工作角色節點,則請選取至少具備八個核心和 14 GB RAM 的前端節點大小。 請在建立叢集時規劃節點,或在建立後透過調整叢集規模的方式進行規劃。
啟用自動調整 選用:選取此核取方塊,以啟用該功能。 如需詳細資訊,請參閱自動調整 Azure HDInsight 叢集
+ 新增指令碼動作 選用:如果您想要在叢集建立時使用自訂指令碼來自訂該叢集,則可以使用此選項。 如需有關指令碼動作的詳細資訊,請參閱使用指令碼動作來自訂 Linux 型 HDInsight 叢集

選取 [檢閱 + 建立 >>] 以驗證叢集設定,並前進至最終索引標籤。

標籤

在 [標籤] 頁面上,提供下列資訊:

屬性 描述
Name 選擇性。 輸入您選擇的名稱,以輕鬆識別所有資源。
保留空白。
資源 選取 [所有選取的資源]。

檢閱 + 建立

顯示 HDInsight 4.0 建立叢集摘要的螢幕快照。

檢閱設定。 選取 [建立] 以建立叢集。

建立叢集需要一些時間,通常約 20 分鐘左右。 監視通知以檢查佈建程序。

建立後

在建立程序完成之後,從 [已成功部署] 通知中選取 [前往資源]。 叢集視窗會提供以下資訊。

顯示 Azure HDInsight 入口網站叢集概觀的螢幕快照。

視窗中的一些圖示說明如下:

屬性 說明
概觀 提供叢集的所有基本資訊。 例如名稱、其所屬資源群組、位置、作業系統,以及叢集儀表板的 URL。
叢集儀表板 將您導向至與叢集相關聯的 Ambari 入口網站。
SSH + 叢集登入 提供使用 SSH 來存取叢集時所需的資訊。
刪除 刪除 HDInsight 叢集。

選取叢集

請參閱使用瀏覽器、PowerShell 或 Azure CLI 刪除 HDInsight 叢集

疑難排解

如果您在建立 HDInsight 叢集時遇到問題,請參閱存取控制需求

下一步

您已成功建立 HDInsight 叢集。 現在,請了解如何使用您的叢集。