步骤 5:将 Linux 节点添加到群集

配置群集后,可以选择添加 HPC Linux 计算节点。 以下是准备和添加 Linux 计算节点的高级步骤。  

重要

所有 HPC Pack 2016 和 2019 Update 2 及更早的群集(包括仅限 Windows 的群集)都必须在将 Linux 节点添加到群集之前 管理 HPC Pack 的 Linux 身份验证密钥,以解决 CVE-2024-49058 严重 漏洞。 更新 setup.py 文件,使其接受 authenticationkey 参数。  

5.1:在计算机上安装 Linux 操作系统

若要部署 HPC Linux 计算节点,必须在计算机上安装受支持的分发版。 有关详细信息,请参阅 Microsoft HPC Pack 2016的系统要求。 

5.2:提取 Linux 计算节点安装二进制文件

部署头节点后,在 HPC Pack 的安装共享中找到本地 Linux 节点安装二进制文件。

通过运行以下 PowerShell 命令获取 HPC Pack 安装共享的路径:

Add-PSSnapin microsoft.hpc 

Get-HpcClusterRegistry -PropertyName InstallShare

该路径在命令输出中返回。

文件 hpcnodeagent.tar.gzsetup.py 是安装本地 Linux 计算节点所需的二进制文件。

5.3:设置文件共享以将安装二进制文件共享到 Linux 计算节点

有多个选择,包括 SMB 共享或 NFS 共享,用于在头节点和 Linux 计算节点之间移动数据。 以下步骤在头节点上设置 SMB 共享,以便与 Linux 计算节点共享二进制文件。    还可以将二进制文件复制到集中式共享。 只需确保可从 Linux 计算节点访问安装文件,并且是需要登录到 Linux 计算节点的用户可执行的。 

提示

如果知道如何将二进制文件部署到可从 Linux 计算节点访问的文件共享,则可以跳过以下说明。

在头节点上设置 SMB 共享

  1. 在头节点上创建一个文件夹,并将其共享到具有读/写权限级别的 每个人。 例如,将头节点上的 C:\SmbShare 共享为 \\<HeadNodeName>\SmbShare。 示例:\\LN15-UB14-HN1\SmbShare。

  2. 在每个 Linux 节点上装载 SMB 共享。 例如,使用以下命令将共享装载到路径/smbshare

    mkdir –p /smbshare  
    
    mount -t cifs //LN15-UB14-HN1/SmbShare /smbshare -o vers=2.1,domain=<domainname>,username=<username>,password='<password>',dir_mode=0777,file_mode=0777  
    
    

    注意

    必须使用 cifs-utils 从 Linux 计算节点装载 SMB 共享。 在 CentOS 和 Red Hat 分发版上,通过运行 yum 安装来安装包 cifs-utils

  3. 将二进制文件hpcnodeagent.tar.gz和 setup.py 复制到头节点中的 \\LN15-UB14-HN1\SmbShare,并检查是否可以在 Linux 计算节点的路径/smbshare 中看到文件。

5.4:安装用于保护 HPC 节点之间的通信的证书

如果头节点 的 证书是自签名的,则应将头节点的公共证书作为受信任的根证书颁发机构安装在 Linux 计算机上。 名为 HpcHnPublicCert.cer 的公共证书位于安装共享 证书 文件夹中。
对于不同的 Linux 分发版,完成此步骤的方法有所不同。 有关详细信息,请查看 Linux 分发版的管理指南。

例如,在 Ubuntu 14.04 LTS 上,使用 openssl将头节点的 CER 格式证书转换为 CRT 格式,将其保存到目录 /usr/local/share/ca-certificate,并运行以下二进制文件:

/usr/sbin/update-ca-certificates

5.5:在计算机上安装 Linux 计算节点代理

通过执行 Python 脚本 setup.py安装 Linux 计算节点。 确保 Python 安装在 Linux 节点上,如果未安装,请安装它。

有关 setup.py的详细用法,请键入 python setup.py --help

例如,若要将 Linux 节点添加到群集,请在每个 Linux 节点上的 Bash shell 中键入类似于以下命令的命令。

python setup.py -install -connectionstring:'<connection string of the cluster>' -certfile:'<path to PFX certificate>'  

5.6:验证配置

成功安装 Linux 节点后,打开 HPC 群集管理器以检查 HPC Pack 群集的状态。

  • 资源管理中,单击“按节点模板 ”列出 Linux 节点 -> LinuxNode 模板。

  • 通过在 资源管理切换到 热度映射 视图来查看 Linux 节点的热度映射。

  • 使用 作业管理中的操作将作业提交到 Linux 节点。

将测试参数扫描作业提交到 Linux 节点

  1. 资源管理中选择 Linux 节点后,请透视到 作业管理, 并单击 新的参数扫描作业

  2. “新建参数扫描作业” 对话框中,指定一个简单的命令行,例如 hostname。 接受其余设置的默认值,然后单击 提交

  3. 作业完成后,双击该项以查看每个任务的输出。 在此示例中,每个 Linux 节点返回其主机名。