选择合适的 HPC SKU
你的研发团队有几个适用于 Azure 的 HPC 选项,下表重点介绍了 HB120_v2、HC44 和 HB60 SKU 之间的主要技术差异。 由于有多个 HPC SKU 可供选择,你可根据 HPC 应用程序性能特征选择合适的 SKU。
突出显示的项目指示特定类别中功能最强的首选 HPC 虚拟机。
HB120_v2 | HC44 | HB60 | |
---|---|---|---|
处理器 | AMD EPYC 7742 (Rome) | Intel Platinum 8168 | AMD EPYC 7551 (Naples) |
无内核(SMI 已禁用) | 120 |
44 | 60 |
CPU 基本频率 | 2.45 GHz | 2.7 GHz |
2.0 GHz |
支持 AVX 512 | 无(每个内核 16 个 FLOP) | Yes (每个核心 32 个 FLOPS) |
无(每个内核 8 个 FLOP) |
理论 MFLOPS (FP64) | ~4000 |
~3000 | ~1000 |
NUMA 域 | 30 | 2 |
15 |
最大 MPI 作业大小 | 36000 cores |
13200 个内核 | 18000 个内核 |
内存大小 | 480 GB |
352 GB | 240 GB |
内存带宽 | 340 GB/s |
190 GB/s | 260 GB/s |
InfiniBand | 200 GB HDR (延迟 ~1.2 微秒) |
100 GB EDR(延迟 ~1.8 微秒) | 100 GB EDR(延迟 ~1.9 微秒) |
本地 SSD 大小 | 960 GB (NVMeDirect), 480 GB |
700 GB | 700 GB |
最大附加磁盘数量 | 8 |
4 | 4 |
成本比率 | 1.58 | 1.39 | 1.0 |
选择 HC44 的原因
- HPC 应用程序有浮点限制,需要有 AVX 512 支持。
- HPC 应用程序对 CPU 频率非常敏感,通常在时钟频率较高时性能更佳。
- Intel 拥有成熟的开发生态系统,因此更易于开发和运行应用程序。
- 长久以来一直使用 Intel 处理器,在这方面经验丰富,所以希望使用 Intel 处理器。
选择 HB120_v2 的原因
- HPC 应用程序有浮点限制,并使用所有可用内核。
- HPC 应用程序有内存带宽限制。
- 紧密耦合 HPC 应用程序有网络限制,对延迟和带宽敏感。
- 紧密耦合 HPC 应用程序具有高度可伸缩性,并且计划运行内核数大于 18,000 个的应用程序。
- 应用程序需要支持 NVMeDirect 的高速本地 NVMe SSD。
- 应用程序需要每个 VM 有四个以上的托管磁盘。
选择 HB60 的原因
- HPC 应用程序在每个 VM 中使用的内核数 <= 60 个。
- HPC 应用程序的内存限制超过浮点限制。
- HPC 应用程序将扩展到内核数小于 18,000 个的较小总内核计数。