針對失敗的Linux計算節點代理程式延伸模組安裝進行疑難解答
本文討論如何針對 HPC Pack Linux 節點代理程式擴充功能未在高效能運算 (HPC) 叢集中的節點上成功安裝的情況進行疑難解答。
疑難排解檢查清單
若要針對 Linux 計算節點上Microsoft.HpcPack.LinuxNodeAgent2016U1 延伸模組的失敗安裝進行疑難解答,請檢查擴充功能記錄檔,然後在基礎結構即服務 (IaaS) 虛擬機上安裝新的 Linux 計算節點(VM)。
步驟 1:檢查延伸模組記錄檔
擴充功能記錄檔可能可協助您判斷節點代理程式未成功安裝的原因。 若要尋找及檢視延伸模組記錄檔,請遵循下列步驟:
開啟系統管理 PowerShell 控制台。
執行下列命令,在前端節點上啟用安全殼層 (SSH) 連線功能:
dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0 Start-Service sshd Set-Service -Name sshd -StartupType 'Automatic' Set-Service -Name ssh-agent -StartupType 'Automatic' Start-Service ssh-agent
在前端節點上,執行下列命令以登入 Linux 計算節點:
ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
輸入網域系統管理員的帳戶密碼。
執行下列命令來確認延伸模組記錄檔是否存在於節點上:
sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
執行或開啟您慣用的文本查看器或編輯器,然後顯示延伸模塊記錄檔的內容。
步驟 2:執行本機測試以高載至 IaaS VM
若要在本機測試如何高載至 IaaS VM,請遵循下列步驟:
請遵循步驟來 建立 Azure IaaS 節點範本。 當您到達 範本建立精靈的 [指定 VM 映像 ] 區段時,請先指定下列設定,再完成建立節點範本。
欄位名稱 值 映像類型 MarketplaceImage OS 類型 Linux 影像標籤 Red Hat Enterprise Linux 7.8 請遵循步驟來 建立 IaaS 計算節點並加以管理。 當您到達 [新增節點精靈] 的 [ 指定新節點 ] 區段時,請先指定下列設定,再完成新增節點。
欄位名稱 值 節點範本 您稍早建立的節點範本名稱。 節點數目 1 節點的 VM 大小 A1 (1 核心,1.75 GB 記憶體) 請遵循在 HPC 叢集管理員中建立新作業的步驟。 當您到達 [資源選取] 區段時,請在 [可用的節點群組] 列表中選取 [LinuxNodes],然後選取 [新增] 按鈕,將專案移至 [選取的節點群組] 清單。 提交新作業之後,將會正確布建Linux節點。
與我們連絡,以取得說明
如果您有問題或需要相關協助,請建立支援要求,或詢問 Azure community 支援。 您也可以向 Azure 意見反應社群提交產品意見反應。