共用方式為


針對失敗的Linux計算節點代理程式延伸模組安裝進行疑難解答

本文討論如何針對 HPC Pack Linux 節點代理程式擴充功能未在高效能運算 (HPC) 叢集中的節點上成功安裝的情況進行疑難解答。

疑難排解檢查清單

若要針對 Linux 計算節點上Microsoft.HpcPack.LinuxNodeAgent2016U1 延伸模組的失敗安裝進行疑難解答,請檢查擴充功能記錄檔,然後在基礎結構即服務 (IaaS) 虛擬機上安裝新的 Linux 計算節點(VM)。

步驟 1:檢查延伸模組記錄檔

擴充功能記錄檔可能可協助您判斷節點代理程式未成功安裝的原因。 若要尋找及檢視延伸模組記錄檔,請遵循下列步驟:

  1. 開啟系統管理 PowerShell 控制台。

  2. 執行下列命令,在前端節點上啟用安全殼層 (SSH) 連線功能:

    dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0
    Start-Service sshd
    Set-Service -Name sshd -StartupType 'Automatic'
    Set-Service -Name ssh-agent -StartupType 'Automatic'
    Start-Service ssh-agent
    
  3. 在前端節點上,執行下列命令以登入 Linux 計算節點:

    ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
    
  4. 輸入網域系統管理員的帳戶密碼。

  5. 執行下列命令來確認延伸模組記錄檔是否存在於節點上:

    sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
    
  6. 執行或開啟您慣用的文本查看器或編輯器,然後顯示延伸模塊記錄檔的內容。

步驟 2:執行本機測試以高載至 IaaS VM

若要在本機測試如何高載至 IaaS VM,請遵循下列步驟:

  1. 請遵循步驟來 建立 Azure IaaS 節點範本。 當您到達 範本建立精靈的 [指定 VM 映像 ] 區段時,請先指定下列設定,再完成建立節點範本。

    欄位名稱
    映像類型 MarketplaceImage
    OS 類型 Linux
    影像標籤 Red Hat Enterprise Linux 7.8
  2. 請遵循步驟來 建立 IaaS 計算節點並加以管理。 當您到達 [新增節點精靈] 的 [ 指定新節點 ] 區段時,請先指定下列設定,再完成新增節點。

    欄位名稱
    節點範本 您稍早建立的節點範本名稱。
    節點數目 1
    節點的 VM 大小 A1 (1 核心,1.75 GB 記憶體)
  3. 請遵循在 HPC 叢集管理員中建立新作業的步驟。 當您到達 [資源選取] 區段時,請在 [可用的節點群組] 列表中選取 [LinuxNodes],然後選取 [新增] 按鈕,將專案移至 [選取的節點群組] 清單。 提交新作業之後,將會正確布建Linux節點。

與我們連絡,以取得說明

如果您有問題或需要相關協助,請建立支援要求,或詢問 Azure community 支援。 您也可以向 Azure 意見反應社群提交產品意見反應。