NDasrA100_v4 大小系列
ND A100 v4 系列虛擬機器 (VM) 是 Azure GPU 系列新的主打產品。 這些大小專為高階深度學習訓練所設計,緊密結合擴大又擴增的 HPC 工作負載。
ND A100 v4 系列從單一 VM 和八個 NVIDIA Ampere A100 40GB Tensor Core GPU 開始提供。 以 ND A100 v4 為基礎的部署可以擴大至數千個 GPU,每個 VM 的互連頻寬為 1.6 TB/秒。 VM 內的每個 GPU 都隨附自己的專用、與拓撲無關的 200 GB/秒 NVIDIA Mellanox HDR InfiniBand 連線。 這些連線會在佔用相同 Azure 虛擬機器擴展集的 VM 之間自動設定,並支援 GPU Direct RDMA。
每個 GPU 都配備 NVLINK 3.0 連線功能,可在 VM 內進行通訊,且有 96 個實體第 2 代 AMD Epyc™ 7V12 (Rome) CPU 核心在背後支援。
這些執行個體可為許多支援 GPU 加速「現成可用」的 AI、ML 和分析工具提供絕佳的效能,例如 TensorFlow、Pytorch、Caffe、RAPIDS 和其他架構。 此外,向外延展的 InfiniBand 互連支援大量現有的 AI 和 HPC 工具,這些工具以 NVIDIA NCCL2 通訊程式庫為建置基礎,以順暢地群集 GPU。
主機規格
部分 | 數量 計數單位 |
規格 SKU 識別碼、效能單位等。 |
---|---|---|
處理器 | 96 個 vCPU | AMD EPYC 7V12 (Rome) [x86-64] |
記憶體 | 900 GiB | |
本機存放區 | 1 個磁碟 | 6000 GiB |
遠端儲存體 | 32 個磁碟 | 80000 IOPS 800 MBps |
網路 | 8 張NIC | 24000 Mbps |
加速器 | 8 GPUs | Nvidia A100 GPU (40GB) |
功能支援
進階儲存體:支援
進階儲存體快取:支援
即時移轉:不支援
記憶體保留更新:不支援
第 2 代 VM:支援
第 1 代 VM:不支援
加速網路:支援
暫時性 OS 磁碟:支援
巢狀虛擬化:不支援
系列中的大小
每個大小的 vCPU (數量) 和記憶體
大小名稱 | vCPU (數量) | 記憶體 (GB) |
---|---|---|
Standard_ND96asr_A100_v4 | 96 | 900 |
VM 基本資源
其他大小資訊
所有可用大小清單:大小
定價計算機:定價計算機
磁碟類型的相關資訊:磁碟類型
下一步
藉由 變更虛擬機的大小,利用工作負載可用的最新效能和功能。
利用Microsoft內部設計的ARM處理器與 Azure Cobalt VM。
了解如何監視 Azure 虛擬機器。