Поделиться через


Серии размеров ND-H100-v5

Виртуальная машина серии ND H100 v5 — это новое флагманское дополнение к семейству GPU Azure. Эта серия предназначена для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.

Серия ND H100 v5 начинается с одной виртуальной машины и восьми gpu NVIDIA H100 Tensor Core. Развертывания на основе ND H100 версии 5 могут масштабироваться до тысяч GPU с 3,2 ТБ пропускной способности взаимодействия на каждую виртуальную машину. Каждый GPU в виртуальной машине предоставляется с собственным выделенным подключением InfiniBand, не зависящим от топологии 400 ГБ/с NVIDIA Quantum-2 CX7. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин, и поддерживают GPU Direct RDMA.

Каждый GPU включает подключение NVLINK 4.0 для обмена данными на виртуальной машине, а экземпляр имеет 96 физических четвертых ядер процессора Intel Xeon Scalable.

Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, масштабируемое взаимодействие InfiniBand поддерживает большой набор существующих средств искусственного интеллекта и HPC, созданных на основе библиотек коммуникации NVIDIA NCCL для эффективного кластеризации gpu.

Спецификации узлов

Часть Количество
Подсчет единиц
Очки
Идентификатор SKU, единицы производительности и т. д.
Процессор 96 виртуальных ЦП Intel Xeon (Sapphire Rapids) [x86-64]
Память 1900 ГиБ
Локальное хранилище 1 диск 28000 ГиБ
Удаленное хранилище 32Disks
Network 8 сетевых адаптеров
Ускорители 8 GPU Nvidia H100 GPU (80 ГБ)

Поддерживаемые компоненты

хранилище класса Premium: поддерживается
кэширование хранилище класса Premium: поддерживается
Динамическая миграция: не поддерживается
Сохранение памяти: не поддерживается
Виртуальные машины поколения 2: поддерживается
Виртуальные машины поколения 1. Не поддерживается
Ускорение сети: поддерживается
Временный диск ОС: поддерживается
Вложенная виртуализация: не поддерживается
Infiniband: поддерживается

Внимание

Чтобы приступить к работе с виртуальными машинами ND H100 версии 5, см. инструкции по настройке и оптимизации рабочей нагрузки HPC, включая конфигурацию драйверов и сети. Из-за увеличения объема памяти ввода-вывода gpu ND H100 v5 требуется использование виртуальных машин поколения 2 и образов Marketplace.

поддержка Azure s Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 и SLES 15 для виртуальных машин ND H100 v5. В настоящее время поддерживаются образы виртуальных машин Ubuntu-HPC 20.4/22.04 и AlmaLinux-HPC 8.6/8.7.

Существуют предложения оптимизированных и предварительно настроенных образов виртуальных машин Linux для рабочих нагрузок HPC/AI с различными установленными средствами и библиотеками HPC, поэтому настоятельно рекомендуется.

Чтобы скачать образ, перейдите в Azure Marketplace.

Размеры рядов

виртуальные ЦП (Qty.) и память для каждого размера

Имя размера виртуальные ЦП (Qty.) Память (ГБ)
Standard_ND96isr_H100_v5 96 1900

Основные ресурсы виртуальной машины

Другие сведения о размере

Список всех доступных размеров: размеры

Калькулятор цен: Калькулятор цен

Сведения о типах дисков: типы дисков

Следующие шаги

Узнайте больше о том, как с помощью единиц вычислений Azure (ACU) сравнить производительность вычислений для различных номеров SKU Azure.

Ознакомьтесь с выделенными узлами Azure для физических серверов, которые могут размещать одну или несколько виртуальных машин, назначенных одной подписке Azure.

Узнайте, как отслеживать виртуальные машины Azure.