你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
NDm_A100_v4 大小系列
NDm A100 v4 系列虚拟机 (VM) 是 Azure GPU 系列的新增旗舰产品。 这些大小专为高端深度学习训练和紧密耦合的纵向扩展和横向扩展 HPC 工作负载而设计。
NDm A100 v4 系列的起步配置是一个 VM 和八个 NVIDIA Ampere A100 80GB Tensor Core GPU。 基于 NDm A100 v4 的部署可以纵向扩展到成千上万个 GPU,每个 VM 的互连带宽为 1.6 TB/秒。 VM 内的每个 GPU 都具备其自己专用的、与拓扑无关的 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 连接。 这些连接在占用同一 Azure 虚拟机规模集的 VM 之间自动配置,并且支持 GPU Direct RDMA。
每个 GPU 都配备了用于 VM 内通信的 NVLINK 3.0 连接,搭载了 96 个物理第 2 代 AMD Epyc™ 7V12 (Rome) CPU 核心。
这些实例为众多 AI、ML、支持 GPU 加速的现成分析工具(如 TensorFlow、Pytorch、Caffe、RAPIDS)以及其他框架提供卓越的性能。 此外,横向扩展 InfiniBand 互连支持一大组基于 NVIDIA 的 NCCL2 通信库构建的现有 AI 和 HPC 工具,以便实现无缝的 GPU 群集化。
主机规格
组成部分 | 数量 计数单位 |
规格 SKU ID、性能单位等 |
---|---|---|
处理器 | 96 个 vCPU | AMD EPYC 7V12 (Rome) [x86-64] |
内存 | 1900 GiB | |
本地存储 | 1 个磁盘 | 6400 GiB |
远程存储 | 32 个磁盘 | 80000 IOPS 800 MBps |
网络 | 8个 NIC | 24000 Mbps |
加速器 | 8 个 GPU | Nvidia A100 GPU (80GB) |
功能支持
高级存储:支持
高级存储缓存:支持
实时迁移:不支持
内存保留更新:不支持
第 2 代 VM:支持
第 1 代 VM:不支持
加速网络:支持
临时 OS 磁盘:支持
嵌套虚拟化:不支持
系列大小
每个大小的 vCPU(数量)和内存
大小名称 | vCPU(数量) | 内存 (GB) |
---|---|---|
Standard_ND96amsr_A100_v4 | 96 | 1900 |
VM 基础知识资源
其他大小信息
所有可用大小的列表:大小
定价计算器:定价计算器
有关磁盘类型的信息:磁盘类型
后续步骤
了解有关 Azure 计算单元 (ACU) 如何帮助跨 Azure SKU 比较计算性能的详细信息。
请参阅 Azure 专用主机,了解能够托管一个或多个分配给一个 Azure 订阅的虚拟机的物理服务器。
了解如何监视 Azure 虚拟机。