本地 Linux 计算节点入门
注意
本文档适用于 HPC Pack 2012 R2 Update 3(如果正在运行 HPC Pack 2016 或 HPC Pack 2019),请参阅此处
从 HPC Pack 2012 R2 Update 3 开始,可以将本地 Linux 计算节点添加到 HPC Pack 群集。 本文介绍如何设置由 HPC Pack 头节点和多个 Linux 计算节点组成的本地 Linux 群集。 可以使用此群集运行 Linux HPC 工作负载。
在本文中:
先决条件
安装了 Windows Server 的一台计算机 - 若要部署 HPC Pack 群集,需要在将充当头节点的计算机(或计算机)上安装受支持的 Windows Server 2012 R2 或 Windows Server 2012 版本。
Active Directory 域 - HPC Pack 群集的头节点必须已加入域。 准备 Active Directory 域,并选择具有足够权限的现有域帐户,以将头节点添加到群集。 有关如何为群集选择 Active Directory 域并选择用于添加节点的域帐户,请参阅 步骤 1.6 和 1.7 中的第 1 部分:在入门指南中准备部署。
有关部署新的 Active Directory 域服务的步骤,请参阅在企业
部署 Active Directory 域服务(AD DS)。 HPC Pack 2012 R2 Update 3 - HPC Pack 2012 R2 Update 3 安装包 包含本地 Linux 计算节点的安装文件。 有关 Linux 节点安装二进制文件的位置和安装步骤,请参阅本文中的其余部分。
运行受支持的 Linux OS 分发 的计算机 - HPC Pack 当前验证并支持以下 Linux 分发版:CentOS 6.6、CentOS 7.0、Red Hat Enterprise Linux 6.6、Red Hat Enterprise Linux 7.1 和 x64 平台上的 Ubuntu 14.04.2。
部署头节点
若要部署和安装头节点,请参阅 步骤 2:在入门指南中部署头节点。
若要配置头节点,请按照 步骤 3 中的过程操作:在入门指南中配置头节点。
注意
目前,在 “配置网络”“部署到”列表中选择群集网络拓扑时,建议使用拓扑 5:仅企业网络上的所有节点。
准备安装 Linux 节点
在本部分中,我们将介绍准备安装 Linux 计算节点的步骤。
提取 Linux 计算节点安装二进制文件
设置文件共享以将安装二进制文件共享到 Linux 计算节点
准备用于头节点与 Linux 计算节点之间的通信的证书
步骤 1. 提取 Linux 计算节点安装二进制文件
部署头节点后,在以下文件夹中找到本地 Linux 节点安装二进制文件:
%CCP_DATA%InstallShare\LinuxNodeAgent。
hpcnodeagent.tar.gz和 setup.py 文件是安装本地 Linux 计算节点所需的二进制文件。
步骤 2. 设置文件共享以将安装二进制文件共享到 Linux 计算节点
有多个选择,包括 SMB 共享或 NFS 共享,用于在头节点和 Linux 计算节点之间移动数据。 以下步骤在头节点上设置 SMB 共享,以便与 Linux 计算节点共享二进制文件。
还可以将二进制文件复制到集中式共享。 只需确保可从 Linux 计算节点访问安装文件,并且是需要登录到 Linux 计算节点的用户可执行的。
提示
如果知道如何将二进制文件部署到可从 Linux 计算节点访问的文件共享,则可以跳过以下说明。
在头节点上设置 SMB 共享
在头节点上创建一个文件夹,并将其共享到具有读/写权限级别的 每个人。 例如,将头节点上的 C:\SmbShare 共享为 \\<HeadNodeName>\SmbShare。 示例:\\LN15-UB14-HN1\SmbShare。
在每个 Linux 节点上装载 SMB 共享。 例如,使用以下命令将共享装载到路径/smbshare:
mkdir –p /smbshare mount -t cifs //LN15-UB14-HN1/SmbShare /smbshare -o vers=2.1,domain=<domainname>,username=<username>,password='<password>',dir_mode=0777,file_mode=0777
注意
必须使用 cifs-utils 从 Linux 计算节点装载 SMB 共享。 在 CentOS 和 Red Hat 分发版上,通过运行 yum 安装来安装包 cifs-utils。
将二进制文件hpcnodeagent.tar.gz和 setup.py 复制到头节点中的 \\LN15-UB14-HN1\SmbShare,并检查是否可以在 Linux 计算节点的路径/smbshare 中看到文件。
步骤 3. 准备用于头节点与 Linux 计算节点之间的通信的证书
出于安全原因,HPC Pack 使用 HTTPS 在 Linux 计算节点和头节点之间通信。 使用以下步骤准备用于通信的证书。
在头节点安装过程中,HPC Pack 在名为 Microsoft“HPC Linux 通信的本地计算机\个人存储中生成自签名证书,可用于测试目的。 可以在生产环境中将其替换为自己的证书。
用于通信的证书必须具有以下属性:
使用者名称与头节点的 FQDN 相同,或者使用者可选名称包含头节点的 FQDN
证书包含私钥
证书可导出
如果证书是自签名的,则它必须包含密钥用法:数字签名、密钥加密、密钥协议和证书签名;并且它必须包含增强型密钥用法(也表示为 openssl 中的 extendedKeyUsage):Sever 身份验证和客户端身份验证
若要配置自己的证书,请在 Windows PowerShell 窗口中运行以下命令:
PS > add-pssnapin Microsoft.HPC
PS > Set-HpcLinuxCertificate –FilePath <My.pfx>
注意
由于上一命令中未指定密码,因此系统会提示输入证书的密码。 有关 set-HpcLinuxCertificate
若要使用 HPC Pack 生成的证书,请在 Windows PowerShell 窗口中运行以下命令,将证书导出到可从 Linux 计算节点访问的共享。 例如,若要将证书导出到 SMB 路径 C:\SmbShare\hpclinuxagent.pfx,请键入:
PS > add-pssnapin Microsoft.HPC
PS > Export-HpcLinuxCertificate –FilePath C:\SmbShare\hpclinuxagent.pfx
注意
由于上一命令中未指定密码,因此系统会提示输入证书的密码。 有关 Export-HpcLinuxCertificate的详细信息,请键入 get-help Export-HpcLinuxCertificate
。
现在可以在 Linux 计算节点的路径 /smbshare 中看到 PFX 文件(此示例中的 hpclinuxagent.pfx)。
安装 Linux 计算节点
通过执行 Python 脚本 setup.py安装 Linux 计算节点。 确保 Python 安装在 Linux 节点上,如果未安装,请安装它。
有关 setup.py的详细用法,请键入 python setup.py –help
。
例如,若要将 Linux 节点添加到群集,请在每个 Linux 节点上的 Bash shell 中键入类似于以下命令的命令:
python setup.py -install -clusname:<FQDN of head node> -certfile:'<path to PFX certificate>'
验证配置
成功安装 Linux 节点后,打开 HPC 群集管理器以检查 HPC Pack 群集的状态。 可以通过多种方式管理和监视 Linux 计算节点:使用 Windows 节点:
在 资源管理中,单击“按节点模板 > LinuxNode 模板 ”列出 Linux 节点节点。
通过在 资源管理切换到 热度映射 视图来查看 Linux 节点的热度映射。
使用 作业管理中的操作将作业提交到 Linux 节点。
将测试参数扫描作业提交到 Linux 节点
在 资源管理中选择 Linux 节点后,请透视到 作业管理, 并单击 新的参数扫描作业。
在 “新建参数扫描作业” 对话框中,指定一个简单的命令行,例如
hostname
。 接受其余设置的默认值,然后单击 提交。作业完成后,双击该项以查看每个任务的输出。 在此示例中,每个 Linux 节点返回其主机名。
有关如何将数据移动并将作业提交到群集的详细信息,请参阅 AzureHPC Pack 群集中的 Linux 计算节点入门
注意事项和限制
Linux 分发版 - 请参阅当前测试的 Linux 分发版的 先决条件,以便与 HPC Pack 兼容。
单头节点配置 - 目前 HPC Pack 仅支持具有 Linux 计算节点的群集中的单个头节点。 无法使用配置为高可用性的头节点。
MPI - 若要在 Linux 节点上运行 MPI 应用程序,必须在节点上安装自己的 MPI 分发版。 Microsoft MPI(MS-MPI),它包含在 HPC Pack 中,仅在 Windows 节点上运行。 计划程序还必须在 Linux 节点之间设置相互信任。 有关示例,请参阅 在 Azure的 Linux 计算节点上使用 Microsoft HPC Pack 运行 NAMD。
GPU 和 SOA 工作负荷不支持 - 目前 HPC Pack 不支持计划到 GPU GPU 或在 Linux 节点上运行 SOA 工作负荷。
另请参阅
- Microsoft HPC Pack:节点部署
- 在 Azure Linux RDMA 群集上使用 Microsoft HPC Pack 运行 OpenFoam