选择合适的 HPC SKU

已完成

你的研发团队有几个适用于 Azure 的 HPC 选项,下表重点介绍了 HB120_v2、HC44 和 HB60 SKU 之间的主要技术差异。 由于有多个 HPC SKU 可供选择,你可根据 HPC 应用程序性能特征选择合适的 SKU。

突出显示的项目指示特定类别中功能最强的首选 HPC 虚拟机。

HB120_v2 HC44 HB60
处理器 AMD EPYC 7742 (Rome) Intel Platinum 8168 AMD EPYC 7551 (Naples)
无内核(SMI 已禁用) 120 44 60
CPU 基本频率 2.45 GHz 2.7 GHz 2.0 GHz
支持 AVX 512 无(每个内核 16 个 FLOP) Yes(每个核心 32 个 FLOPS) 无(每个内核 8 个 FLOP)
理论 MFLOPS (FP64) ~4000 ~3000 ~1000
NUMA 域 30 2 15
最大 MPI 作业大小 36000 cores 13200 个内核 18000 个内核
内存大小 480 GB 352 GB 240 GB
内存带宽 340 GB/s 190 GB/s 260 GB/s
InfiniBand 200 GB HDR(延迟 ~1.2 微秒) 100 GB EDR(延迟 ~1.8 微秒) 100 GB EDR(延迟 ~1.9 微秒)
本地 SSD 大小 960 GB (NVMeDirect), 480 GB 700 GB 700 GB
最大附加磁盘数量 8 4 4
成本比率 1.58 1.39 1.0

选择 HC44 的原因

  • HPC 应用程序有浮点限制,需要有 AVX 512 支持。
  • HPC 应用程序对 CPU 频率非常敏感,通常在时钟频率较高时性能更佳。
  • Intel 拥有成熟的开发生态系统,因此更易于开发和运行应用程序。
  • 长久以来一直使用 Intel 处理器,在这方面经验丰富,所以希望使用 Intel 处理器。

选择 HB120_v2 的原因

  • HPC 应用程序有浮点限制,并使用所有可用内核。
  • HPC 应用程序有内存带宽限制。
  • 紧密耦合 HPC 应用程序有网络限制,对延迟和带宽敏感。
  • 紧密耦合 HPC 应用程序具有高度可伸缩性,并且计划运行内核数大于 18,000 个的应用程序。
  • 应用程序需要支持 NVMeDirect 的高速本地 NVMe SSD。
  • 应用程序需要每个 VM 有四个以上的托管磁盘。

选择 HB60 的原因

  • HPC 应用程序在每个 VM 中使用的内核数 <= 60 个。
  • HPC 应用程序的内存限制超过浮点限制。
  • HPC 应用程序将扩展到内核数小于 18,000 个的较小总内核计数。