Серии размеров ND-H100-v5
Виртуальная машина серии ND H100 v5 — это новое флагманское дополнение к семейству GPU Azure. Эта серия предназначена для высокоуровневого обучения глубокого обучения и тесно связана с масштабируемыми и масштабируемыми рабочими нагрузками ИИ и HPC.
Серия ND H100 v5 начинается с одной виртуальной машины и восьми gpu NVIDIA H100 Tensor Core. Развертывания на основе ND H100 версии 5 могут масштабироваться до тысяч GPU с 3,2 ТБ пропускной способности взаимодействия на каждую виртуальную машину. Каждый GPU в виртуальной машине предоставляется с собственным выделенным подключением InfiniBand, не зависящим от топологии 400 ГБ/с NVIDIA Quantum-2 CX7. Эти подключения автоматически настраиваются между виртуальными машинами, занимающими один и тот же масштабируемый набор виртуальных машин, и поддерживают GPU Direct RDMA.
Каждый GPU включает подключение NVLINK 4.0 для обмена данными на виртуальной машине, а экземпляр имеет 96 физических четвертых ядер процессора Intel Xeon Scalable.
Эти экземпляры обеспечивают отличную производительность для многих средств искусственного интеллекта, машинного обучения и аналитики, которые поддерживают ускорение GPU "вне коробки", такие как TensorFlow, Pytorch, Caffe, RAPIDS и другие платформы. Кроме того, масштабируемое взаимодействие InfiniBand поддерживает большой набор существующих средств искусственного интеллекта и HPC, созданных на основе библиотек коммуникации NVIDIA NCCL для эффективного кластеризации gpu.
Спецификации узлов
Часть | Количество Подсчет единиц |
Очки Идентификатор SKU, единицы производительности и т. д. |
---|---|---|
Процессор | 96 виртуальных ЦП | Intel Xeon (Sapphire Rapids) [x86-64] |
Память | 1900 ГиБ | |
Локальное хранилище | 1 диск | 28000 ГиБ |
Удаленное хранилище | 32Disks | |
Network | 8 сетевых адаптеров | |
Ускорители | 8 GPU | Nvidia H100 GPU (80 ГБ) |
Поддерживаемые компоненты
хранилище класса Premium: поддерживается
кэширование хранилище класса Premium: поддерживается
Динамическая миграция: не поддерживается
Сохранение памяти: не поддерживается
Виртуальные машины поколения 2: поддерживается
Виртуальные машины поколения 1. Не поддерживается
Ускорение сети: поддерживается
Временный диск ОС: поддерживается
Вложенная виртуализация: не поддерживается
Infiniband: поддерживается
Внимание
Чтобы приступить к работе с виртуальными машинами ND H100 версии 5, см. инструкции по настройке и оптимизации рабочей нагрузки HPC, включая конфигурацию драйверов и сети. Из-за увеличения объема памяти ввода-вывода gpu ND H100 v5 требуется использование виртуальных машин поколения 2 и образов Marketplace.
поддержка Azure s Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 и SLES 15 для виртуальных машин ND H100 v5. В настоящее время поддерживаются образы виртуальных машин Ubuntu-HPC 20.4/22.04 и AlmaLinux-HPC 8.6/8.7.
Существуют предложения оптимизированных и предварительно настроенных образов виртуальных машин Linux для рабочих нагрузок HPC/AI с различными установленными средствами и библиотеками HPC, поэтому настоятельно рекомендуется.
Чтобы скачать образ, перейдите в Azure Marketplace.
Размеры рядов
виртуальные ЦП (Qty.) и память для каждого размера
Имя размера | виртуальные ЦП (Qty.) | Память (ГБ) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Основные ресурсы виртуальной машины
Другие сведения о размере
Список всех доступных размеров: размеры
Калькулятор цен: Калькулятор цен
Сведения о типах дисков: типы дисков
Следующие шаги
Узнайте больше о том, как с помощью единиц вычислений Azure (ACU) сравнить производительность вычислений для различных номеров SKU Azure.
Ознакомьтесь с выделенными узлами Azure для физических серверов, которые могут размещать одну или несколько виртуальных машин, назначенных одной подписке Azure.
Узнайте, как отслеживать виртуальные машины Azure.