你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
ND-MI300X-v5 大小系列
ND MI300X v5 系列虚拟机 (VM) 是 Azure GPU 系列的新增旗舰产品。 它专为高端深度学习训练和紧密耦合的纵向扩展和横向扩展生成式 AI 和 HPC 工作负载而设计。
ND MI300X v5 系列 VM 起始配置包含八个 AMD Instinct MI300 GPU 和两个第四代 Intel Xeon 可扩展处理器,共有 96 个物理核心。 然后,VM 中的每个 GPU 通过第四代 AMD Infinity Fabric 链路相互连接,每个 GPU 的带宽为 128 GB/s,总带宽为 896 GB/s。
基于 ND MI300X v5 的部署可以纵向扩展到成千上万个 GPU,每个 VM 的互连带宽为 3.2 Tb/秒。 VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 400 Gb/秒 NVIDIA Quantum-2 CX7 InfiniBand 连接。 这些连接在占用同一虚拟机规模集的 VM 之间自动配置,并且支持 GPUDirect RDMA。
这些实例为众多支持 GPU 加速的现成 AI、ML、分析工具(如 TensorFlow、Pytorch 以及其他框架)提供了卓越的性能。 此外,横向扩展 InfiniBand 互连还支持大量基于 AMD 的 ROCm 通信集合库 (RCCL) 构建的现有 AI 和 HPC 工具,可实现 GPU 的无缝群集。
主机规格
组成部分 | 数量 计数单位 |
规格 SKU ID、性能单位等 |
---|---|---|
处理器 | 96 个 vCPU | Intel Xeon (Sapphire Rapids) [x86-64] |
内存 | 1850 GiB | |
本地存储 | 1 个临时磁盘 8 个 NVMe 磁盘 |
1000 GiB 临时磁盘 28000 GiB NVMe 磁盘 |
远程存储 | 32 个磁盘 | 80000 IOPS 1200 MBps |
网络 | 8个 NIC | |
加速器 | 8 个 GPU | AMD Instinct MI300X GPU (192GB) |
功能支持
高级存储:支持
高级存储缓存:支持
实时迁移:不支持
内存保留更新:不支持
第 2 代 VM:支持
第 1 代 VM:不支持
加速网络:支持
临时 OS 磁盘:支持
嵌套虚拟化:不支持
系列大小
每个大小的 vCPU(数量)和内存
大小名称 | vCPU(数量) | 内存 (GB) |
---|---|---|
Standard_ND96isr_MI300X_v5 | 96 | 1850 |
VM 基础知识资源
其他大小信息
所有可用大小的列表:大小
定价计算器:定价计算器
有关磁盘类型的信息:磁盘类型
后续步骤
了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。
请参阅 Azure 专用主机,了解能够托管一个或多个分配给一个 Azure 订阅的虚拟机的物理服务器。
了解如何监视 Azure 虚拟机。