你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在支持 InfiniBand 的 HB 系列和 N 系列 VM 上进行高性能计算

适用于:✔️ Linux VM ✔️ Windows VM ✔️ 灵活规模集 ✔️ 统一规模集

Azure 的支持 InfiniBand 的 H 系列和 N 系列 VM 旨在为各种实际 HPC 和 AI 工作负载提供领先的性能、消息传递接口 (MPI) 可伸缩性和成本效益。 这些高性能计算 (HPC) 优化 VM 用于解决科学和工程方面的一些计算密集程度最高的问题(如:流体动力学、地球建模、天气模拟等)。

这些文章介绍如何在 Azure 上开始使用支持 InfiniBand 的 H 系列和 N 系列 VM,以及在 VM 上开始使用 HPC 和 AI 工作负载进行优化配置来实现可伸缩性。

特性和功能

支持 InfiniBand 的 HB 系列和 N 系列 VM 旨在为 HPC 工作负载提供最佳 HPC 性能、MPI 可伸缩性和成本效益。 请参阅 HB 系列N 系列 VM,以详细了解 VM 的特性和功能。

RDMA 和 InfiniBand

支持 RDMAHB 系列N 系列 VM 通过低延迟的高带宽 InfiniBand 网络进行通信。 此类互连上的 RDMA 功能对于提高分布式节点 HPC 和 AI 工作负载的可伸缩性和性能至关重要。 支持 InfiniBand 的 H 系列和 N 系列 VM 采用非阻塞性胖树进行连接,使用的小直径旨在实现一致的优化 RDMA 性能。 请参阅启用 InfiniBand,详细了解如何在支持 InfiniBand 的 VM 上设置 InfiniBand。

消息传递接口

支持 SR-IOV 的 HB 系列和 N 系列几乎支持所有 MPI 库和版本。 部分最常用的 MPI 库为: Intel MPI、OpenMPI、HPC-X、MVAPICH2、MPICH、平台 MPI。 支持所有远程直接内存访问(RDMA)谓词。 请参阅设置 MPI,详细了解如何安装各种受支持的 MPI 库及其最佳配置。

入门

第一步是基于 VM 规范和 RDMA 功能选择对工作负载最佳的 HB 系列N 系列 VM 类型。 其次,通过启用 InfiniBand 来配置 VM。 可通过各种方法实现此目的,包括使用内嵌驱动程序的优化 VM 映像;有关详细信息,请参阅针对 Linux 进行优化启用 InfiniBand。 第三,对于分布式节点工作负载,适当地选择和配置 MPI 至关重要。 有关详细信息,请参阅设置 MPI。 第四,为了提高性能和可伸缩性,请按照特定于 VM 系列的指导(如 HBv3 系列概述HC 系列概述)对工作负载进行优化配置。

后续步骤