你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

NDm_A100_v4 大小系列

NDm A100 v4 系列虚拟机 (VM) 是 Azure GPU 系列的新增旗舰产品。 这些大小专为高端深度学习训练和紧密耦合的纵向扩展和横向扩展 HPC 工作负载而设计。

NDm A100 v4 系列的起步配置是一个 VM 和八个 NVIDIA Ampere A100 80GB Tensor Core GPU。 基于 NDm A100 v4 的部署可以纵向扩展到成千上万个 GPU,每个 VM 的互连带宽为 1.6 TB/秒。 VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 连接。 这些连接在占用同一 Azure 虚拟机规模集的 VM 之间自动配置,并且支持 GPU Direct RDMA。

每个 GPU 都配备了用于 VM 内通信的 NVLINK 3.0 连接,搭载了 96 个物理第 2 代 AMD Epyc™ 7V12 (Rome) CPU 核心。

这些实例为众多 AI、ML、支持 GPU 加速的现成分析工具(如 TensorFlow、Pytorch、Caffe、RAPIDS)以及其他框架提供卓越的性能。 此外,横向扩展 InfiniBand 互连支持一大组基于 NVIDIA 的 NCCL2 通信库构建的现有 AI 和 HPC 工具,以便实现无缝的 GPU 群集化。

主机规格

组成部分 数量
计数单位
规格
SKU ID、性能单位等
处理器 96 个 vCPU AMD EPYC 7V12 (Rome) [x86-64]
内存 1900 GiB
本地存储 1 个磁盘 6400 GiB
远程存储 32 个磁盘 80000 IOPS
800 MBps
网络 8个 NIC 24000 Mbps
加速器 8 个 GPU Nvidia A100 GPU (80GB)

功能支持

高级存储:支持
高级存储缓存:支持
实时迁移:不支持
内存保留更新:不支持
第 2 代 VM:支持
第 1 代 VM:不支持
加速网络:支持
临时 OS 磁盘:支持
嵌套虚拟化:不支持

系列大小

每个大小的 vCPU(数量)和内存

大小名称 vCPU(数量) 内存 (GB)
Standard_ND96amsr_A100_v4 96 1900

VM 基础知识资源

其他大小信息

所有可用大小的列表:大小

定价计算器:定价计算器

有关磁盘类型的信息:磁盘类型

后续步骤

了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。

请参阅 Azure 专用主机,了解能够托管一个或多个分配给一个 Azure 订阅的虚拟机的物理服务器。

了解如何监视 Azure 虚拟机