节点错误“HPC Node Manager 服务无法访问”

本文提供了 HPC 管理控制台显示“HPC 节点管理器服务无法访问”错误的问题的解决方案。

现象

计算节点的运行状况处于错误状态,节点连接性在 HPC 管理控制台中显示“HPC 节点管理器服务无法访问”错误。

HPC 服务日志显示以下错误:

在 Store My, LocalMachine 中找不到指纹指纹 <ID> 的证书。

原因

如果头节点上安装的证书与计算节点不匹配,则会出现此问题。

解决方法

若要解决此问题,请验证头节点上的证书和计算节点上是否满足 要求。 然后,将证书从头节点导入到计算节点。 可以在头节点上 \\<headnode>\REMINST\Certificates的 HPC 文件共享中找到具有公钥的证书。

或者,可以生成新的自签名证书,然后在群集中轮换证书。 有关详细信息,请参阅 轮换 HPC Pack 节点通信证书