共用方式為


HPC 計算節點未顯示或處於錯誤狀態

本文提供一個解決方案,說明當您在 Azure 上部署高效能運算 (HPC) 叢集時,計算節點未顯示或處於錯誤狀態的問題。

徵兆

當您在 Azure 上部署 HPC 叢集時,部署會成功,但計算節點不會顯示或處於錯誤狀態。 您會在計算節點上的 HpcNodeManager 服務記錄中看到憑證和網路相關錯誤。

以下是網路錯誤範例:

System.Net.Sockets.SocketException:連線嘗試失敗,因為連線者在一段時間后未正確回應,或已建立的連接失敗,因為連線主機無法回應 x.x.x.x:xxx

原因

發生此問題的原因是網路設定問題或某種類型的憑證不符。

解決方法

檢查計算節點上 HpcNodeManager 服務記錄中的網路和憑證錯誤。

如果有的話,請更正憑證不符。 如需詳細資訊,請參閱 管理 HPC Pack 2019 叢集的憑證。

若要解決上述錯誤的網路問題,請設定網路安全組規則和防火牆規則。 如需詳細資訊,請參閱從 HPC Pack 叢集高載至 Azure IaaS VM 中的<設定 Azure 虛擬網路網路安全組>一節。

與我們連絡,以取得說明

如果您有問題或需要相關協助,請建立支援要求,或詢問 Azure community 支援。 您也可以向 Azure 意見反應社群提交產品意見反應。