共用方式為


使用 Azure 入口網站管理 HDInsight 中的 Apache Hadoop 叢集

藉由使用 Azure 入口網站,您可以在 Azure HDInsight 中管理 Apache Hadoop 叢集。 使用索引標籤選取器,以取得使用其他工具來管理 HDInsight 中 Hadoop 叢集的資訊。

必要條件

HDInsight 中現有的 Apache Hadoop 叢集。 如需詳細資訊,請參閱使用 Azure 入口網站 在 HDInsight 中建立以 Linux 為基礎的叢集。

開始使用

登入入口網站

列出和顯示叢集

[HDInsight 叢集] 頁面會列出您的現有叢集。 從入口網站:

  1. 在左側功能表上,選取 [所有服務]
  2. 在 [分析] 底下,選取 [HDInsight 叢集]。

叢集首頁

在 [ HDInsight 叢集] 頁面上,選取您的叢集名稱。 [概 ] 窗格隨即開啟,看起來類似下圖。

顯示 HDInsight 叢集基本 Azure 入口網站 螢幕快照。

頂端功能表

項目 說明
移動 將叢集移至另一個資源群組或另一個訂用帳戶。
刪除 刪除叢集。
重新整理 重新整理檢視。

左側功能表

左側功能表有多個區段。

左上方功能表

項目 說明
概觀 提供叢集的一般資訊。
活動記錄檔 顯示和查詢活動記錄。
存取控制 (IAM) 使用角色指派。 請參閱指派 Azure 角色來管理 Azure 訂用帳戶資源的存取權
Tags (標籤) 設定索引鍵/值組,以定義雲端服務的自定義分類法。 例如,您可以建立名為 專案的索引鍵,然後針對與特定專案相關聯的所有服務使用通用值。
診斷並解決問題 顯示疑難排解資訊。
快速入門 顯示可協助您開始使用 HDInsight 的資訊。
工具 HDInsight 相關工具的說明資訊。

設定功能表

項目 說明
叢集大小 檢查、增加和減少叢集背景工作節點的數目。 請參閱調整叢集
配額限制 顯示訂用帳戶的已使用和可用核心。
SSH + 叢集登入 顯示使用安全殼層 (SSH) 連線來連線到叢集的指示。 如需詳細資訊,請參閱搭配 HDInsight 使用 SSH
Azure Data Lake Storage Gen2 \(部分機器翻譯\) 設定 Data Lake Storage Gen2 的存取權。 請參閱快速入門:在 HDInsight 中設定叢集
儲存體帳戶 檢視儲存體帳戶和金鑰。 儲存體帳戶是在進行叢集建立程序時設定。
應用程式 新增或移除 HDInsight 應用程式。 請參閱安裝自訂 HDInsight 應用程式
指令碼動作 在叢集上執行 Bash 指令碼。 請參閱 使用指令碼動作自訂 Linux 型 HDInsight 叢集
外部中繼存放區 檢視 Apache Hive \(英文\) 和 Apache Oozie \(英文\) 中繼存放區。 您只能在叢集建立程式期間設定中繼存放區。
HDInsight 合作夥伴 新增或移除目前的 HDInsight 合作夥伴。
屬性 檢視叢集屬性
鎖定 新增鎖定以防止叢集遭到修改或刪除。
匯出範本 顯示和匯出叢集的 Azure Resource Manager 範本。 目前,您只能匯出相依 Azure 儲存體 帳戶。 請參閱 使用 Azure Resource Manager 範本在 HDInsight 中建立以 Linux 為基礎的 Apache Hadoop 叢集。

[監視] 功能表

項目 說明
警示 管理警示和動作。
計量 在 Azure 監視器記錄中監視叢集計量。
診斷設定 設定儲存診斷計量的位置。
Azure 監視器 在 Azure 監視器中監視您的叢集

[支援 + 疑難排解] 功能表

項目 說明
資源健康情況 請參閱 Azure 資源健康情況概觀
新的支援要求 使用 Microsoft 支援服務 建立支援票證。

叢集屬性

在叢集首頁[設定] 底下,選取 [屬性]。

項目 說明
HOSTNAME 叢集名稱。
叢集 URL Ambari Web 介面的 URL。
私人端點 叢集的私人端點。
安全殼層 用來透過 SSH 存取叢集的使用者名稱和主機名。
地位 其中一個已中止、Accepted、ClusterStorageProvisioned、AzureVMConfiguration、HDInsightConfiguration、Operational、Running、Error、Delete、Deleted、Timeout、DeleteQueued、DeleteTimeout、DeleteError、PatchQueued、CertRolloverQueued、ResizeQueued 或 ClusterCustomization。
地區 Azure 位置。 如需支援的 Azure 位置清單,請參閱 HDInsight 定價上的區域下拉式清單。
建立日期 叢集部署的日期。
操作系統 Windows 或 Linux。
類型 Hadoop、HBase 或 Spark。
版本 請參閱 HDInsight 版本
最低的 TLS 版本 傳輸層安全性 (TLS) 版本。
訂閱 訂用帳戶名稱。
默認數據源 預設叢集檔案系統。
背景工作節點大小 背景工作節點選取的虛擬機 (VM) 大小。
前端節點大小 前端節點的選取 VM 大小。
虛擬網路 如果部署時已選取叢集,則為虛擬網路的名稱。

移動叢集

您可以將 HDInsight 叢集移至另一個 Azure 資源群組或另一個訂用帳戶。

叢集首頁上:

  1. 在頂端功能表上,選取 [ 移動]。

  2. 選取 [移至另一個資源群組] 或 [移至另一個訂用帳戶]

  3. 遵循新頁面上的指示。

刪除叢集

刪除叢集並不會刪除預設記憶體帳戶或任何連結的記憶體帳戶。 您可以使用相同的儲存體帳戶和相同的中繼存放區重新建立叢集。 建議您在重新建立叢集時使用新的預設 Blob 容器。

叢集首頁上:

  1. 在頂端功能表上,選取 [ 刪除]。
  2. 遵循新頁面上的指示。

如需詳細資訊,請參閱 暫停或關閉叢集

新增更多儲存體帳戶

建立叢集之後,您可以新增更多 Azure 儲存體 帳戶和 Azure Data Lake Storage 帳戶。 如需詳細資訊,請參閱將其他儲存體帳戶新增至 HDInsight

擴充叢集

您可以使用叢集調整功能來變更 HDInsight 叢集所使用的背景工作節點數目,而不需要重新建立叢集。

如需詳細資訊,請參閱 調整 HDInsight 叢集

暫停或關閉叢集

大部分 Hadoop 作業都是只偶爾執行的批次作業。 針對大部分的 Hadoop 叢集,叢集不會用於處理時,會有大量的時間。 利用 HDInsight,您的資料會儲存在 Azure 儲存體中,以便您在未使用叢集時安全地刪除該叢集。 您也需支付 HDInsight 叢集的費用 (即使未使用該叢集)。 因為叢集的費用是記憶體費用的倍數,所以在未使用叢集時刪除叢集是合理的。

您可以透過許多方式來程式設計程式。 您可以使用:

如需定價資訊,請參閱 HDInsight 定價。 若要從入口網站刪除叢集,請參閱 刪除叢集

升級叢集

如需詳細資訊,請參閱 將 HDInsight 叢集升級至較新版本。

開啟 Apache Ambari Web UI

Ambari 提供直覺且易於使用的 Hadoop 管理 Web UI,其 RESTful API 所支援。 透過Ambari,系統管理員可以管理及監視Hadoop叢集。

叢集首頁上:

  1. 選取 [叢集儀表板]

    顯示 HDInsight Apache Hadoop 叢集功能表的螢幕快照。

  2. 在新頁面上,選取 [Ambari 首頁]。

  3. 輸入叢集使用者名稱和密碼。 預設的叢集使用者名稱為 admin

如需詳細資訊,請參閱 使用 Apache Ambari Web UI 管理 HDInsight 叢集。

變更密碼

HDInsight 叢集可以有兩個使用者帳戶。 HDInsight 叢集使用者帳戶 (HTTP 使用者帳戶) 及 SSH 使用者帳戶都會在建立程序期間建立。 您可以使用入口網站來變更叢集用戶帳戶密碼,並使用腳本動作來變更 SSH 用戶帳戶。

變更叢集使用者密碼

注意

變更叢集使用者 (admin) 密碼可能會導致針對此叢集執行的腳本動作失敗。 如果您有任何以背景工作角色節點為目標的持續性腳本動作,當您透過重設大小作業將節點新增至叢集時,這些腳本可能會失敗。 如需腳本動作的詳細資訊,請參閱 使用腳本動作自定義 HDInsight 叢集。

叢集首頁上:

  1. 在 [設定] 底下,選取 [SSH + 叢集登入]。
  2. 選取 [重設認證]
  3. 在文字框中輸入並確認新的密碼。
  4. 選取 [確定]。

叢集中所有節點上的密碼會變更。

變更 SSH 使用者密碼或公開金鑰

  1. 使用文字編輯器將下列文字儲存為名為 changecredentials.sh的檔案。

    重要

    您必須使用做 LF 為行尾的編輯器。 如果編輯器使用 CRLF,腳本將無法運作。

    #! /bin/bash
    USER=$1
    PASS=$2
    usermod --password $(echo $PASS | openssl passwd -1 -stdin) $USER
    
  2. 使用 HTTP 或 HTTPS 位址,將檔案上傳至您可以從 HDInsight 存取的儲存位置。 例如,公用檔案存放區,例如 OneDrive 或 Azure Blob 儲存體。 將 URI (HTTP 或 HTTPS 位址) 儲存至檔案。 下一個步驟需要 URI。

  3. 在叢集首頁的 [設定] 底下,選取 [腳本動作]。

  4. 在 [ 腳本動作] 頁面上,選取 [ 提交新的]。

  5. 在 [ 提交腳本動作 ] 頁面上,輸入下表中的資訊。

    注意

    SSH 密碼不能包含下列字元:“ ' ' / \ < % ~ |$ & ! #

    欄位
    指令碼類型 從下拉式清單中選取 [ - 自定義 ]。
    名稱 「變更 ssh 認證」。
    Bash 腳本 URI 檔案的 changecredentials.sh URI。
    節點類型:Head、Worker、Nimbus、Supervisor 或 ZooKeeper 針對列出的所有節點類型選取 ✓ 。
    參數 輸入 SSH 使用者名稱,然後輸入新的密碼。 使用者名稱和密碼之間應該只有一個空格。
    儲存此文稿動作... 將此欄位保持清除。
  6. 按一下 [建立] 套用指令碼。 腳本完成之後,您可以使用 SSH 搭配新的認證來連線到叢集。

尋找訂用帳戶識別碼

每個叢集都會繫結至一個 Azure 訂用帳戶。 叢集首頁會顯示 Azure 訂用帳戶標識碼。

尋找資源群組

在 Resource Manager 模式中,會使用 Resource Manager 群組建立每個 HDInsight 叢集。 Resource Manager 群組會顯示在 叢集首頁上。

尋找儲存體帳戶

HDInsight 叢集會使用 Azure 儲存體 帳戶或 Data Lake Storage 來儲存數據。 每個 HDInsight 叢集都可以有一個預設記憶體帳戶和許多連結的記憶體帳戶。 若要列出記憶體帳戶,請在叢集首頁的 [設定] 底下,選取 [儲存體帳戶]。

監視工作

如需詳細資訊,請參閱 使用 Apache Ambari Web UI 管理 HDInsight 叢集。

叢集大小

叢集首頁上的 [叢集大小] 圖格會顯示配置給此叢集的核心數目,以及它們如何配置給此叢集中的節點。

重要

若要監視 HDInsight 叢集所提供的服務,您必須使用 Ambari Web UI 或 Ambari REST API。 如需使用Ambari的詳細資訊,請參閱 使用Apache Ambari管理 HDInsight 叢集。

連接到叢集

在本文中,您已了解一些基本的系統管理功能。 如需詳細資訊,請參閱下列文章: