共用方式為


使用自訂 Ambari DB 設定 HDInsight 叢集

Apache Ambari 可簡化 Apache Hadoop 叢集的管理和監視。 Ambari 提供了易於使用的 Web UI 和 REST API。 Ambari 包含於 HDInsight 叢集中,可用來監視叢集及進行設定變更。

在一般叢集建立中,如在 HDInsight 中設定叢集等其他文章所述,Ambari 會部署在由 HDInsight 管理的 S0 Azure SQL 資料庫 中,而且用戶無法存取。

自訂 Ambari DB 功能可讓您在您所管理的外部資料庫中部署新的叢集並設定 Ambari。 部署是使用 Azure Resource Manager 範本來完成。 本功能具有下列優勢:

  • 自訂 - 您可選擇資料庫的大小和處理容量。 若有處理密集工作負載的大量叢集,則規格較低的 Ambari 資料庫可能會成為管理作業的瓶頸。
  • 彈性 - 您可視需要調整資料庫,以符合您的需求。
  • 控制 - 您可使用符合組織需求的方式,以管理資料庫的備份和安全性。

本文其餘部分將討論下列幾點:

  • 使用自訂 Ambari DB 功能的需求
  • 使用自己的 Apache Ambari 外部資料庫,佈建 HDInsight 叢集所需的步驟

自訂 Ambari DB 需求

您可部署所有叢集類型和版本的自訂 Ambari DB。 多個叢集無法使用相同的Ambari DB。

自訂 Ambari DB 有下列其他需求:

  • 資料庫的名稱不能包含連字元或空格
  • 您必須具備現有的 Azure SQL DB 伺服器和資料庫。
  • 您為 Ambari 安裝提供的資料庫必須空白。 預設 dbo 結構描述中不應有資料表。
  • 先前連線至資料庫的使用者應有資料庫的 SELECT、CREATE TABLE、INSERT、UPDATE、DELETE、ALTER ON SCHEMA 和 REFERENCES 權限。
GRANT CREATE TABLE TO newuser;
GRANT INSERT TO newuser;
GRANT SELECT TO newuser;
GRANT UPDATE TO newuser;
GRANT DELETE TO newuser;
GRANT ALTER ON SCHEMA::dbo TO newuser;
GRANT REFERENCES ON SCHEMA::dbo TO newuser;
  • 在裝載 Ambari 的伺服器上,開啟 [允許存取 Azure 服務] 選項。
  • 防火牆規則必須允許 HDInsight 服務的管理 IP 位址。 如需伺服器層級防火牆規則必須新增的 IP 位址清單,請參閱 HDInsight 管理 IP 位址

在外部資料庫中裝載 Apache Ambari DB 時,請記住下列幾點:

  • 您須負擔裝載 Ambari 的 Azure SQL DB 額外成本。
  • 定期備份您的自訂 Ambari DB。 Azure SQL Database 會自動產生備份,但備份保留時間範圍有所不同。 如需詳細資訊,請參閱了解自動 SQL Database 備份
  • 在 HDInsight 叢集達到執行中狀態後,請勿變更自訂的 Ambari DB 密碼。 不支援。

注意

您可以使用受控識別向Ambari的 SQL 資料庫進行驗證。 如需詳細資訊,請參閱在 Azure HDInsight 中使用受控識別進行 SQL 資料庫 驗證

使用自訂 Ambari DB 部署叢集

若要建立使用自己的外部 Ambari 資料庫 HDInsight 叢集,請使用自訂 Ambari DB 快速入門範本

編輯 azuredeploy.parameters.json 中的參數,以指定新叢集及要裝載 Ambari 的資料庫相關資訊。

您可使用 Azure CLI 開始部署。 將 <RESOURCEGROUPNAME> 取代為要部署叢集的資源群組。

az deployment group create --name HDInsightAmbariDBDeployment \
    --resource-group <RESOURCEGROUPNAME> \
    --template-file azuredeploy.json \
    --parameters azuredeploy.parameters.json

警告

針對 HDInsight 叢集,請使用下列建議的 SQL DB 和 Headnode VM。 請勿針對任何生產環境使用預設的Ambari DB(S0)。

調整資料庫及前端節點大小

下表提供依 HDInsight 叢集大小選取的 Azure SQL DB 層指導方針。

背景工作角色節點的數目 必要的 DB 層 必要的前端節點 VM
<=4 S0 4 核心/28 GB RAM 或更高版本
>4 && <=8 S1 4 核心/28 GB RAM 或更高版本
>8 && <=16 S2 4 核心/28 GB RAM 或更高版本
>16 && <=32 S3 8 核心/56 GB RAM 或更高版本
>32 && <=64 S4 8 核心/56 GB RAM 或更高版本
>64 && <=128 P2 16 核心/112 GB RAM 或更高版本
>128 請連絡支援人員 請連絡支援人員

下一步