Udostępnij za pośrednictwem


Serie rozmiarów ND-H100-v5

Maszyna wirtualna z serii ND H100 v5 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Ta seria jest przeznaczona do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanego ze skalowaniem w górę i skalowalnego w poziomie obciążeń sztucznej inteligencji i HPC.

Seria ND H100 v5 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA H100 Tensor Core. Wdrożenia oparte na ND H100 v5 mogą być skalowane w górę do tysięcy procesorów GPU z 3,2 Tb/s przepustowości połączenia międzylokacyjnej na maszynę wirtualną. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Quantum-2 CX7 InfiniBand o pojemności 400 Gb/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych i obsługują funkcję RDMA bezpośredniego procesora GPU.

Każdy procesor GPU oferuje łączność NVLINK 4.0 na potrzeby komunikacji na maszynie wirtualnej, a wystąpienie ma 96 rdzeni procesora Intel Xeon Scalable 96 generacji.

Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotekach komunikacyjnych NCCL firmy NVIDIA na potrzeby bezproblemowego klastrowania procesorów GPU.

Specyfikacje hosta

Element Ilość
Liczba jednostek
Specyfikacje
Identyfikator jednostki SKU, jednostki wydajności itp.
Procesor 96 procesorów wirtualnych Intel Xeon (Sapphire Rapids) [x86-64]
Pamięć 1900 GiB
Magazyn lokalny 1 Dysk 28000 GiB
Magazyn zdalny 32Disks
Sieć 8 kart sieciowych
Akceleratory 8 procesorów GPU Procesor GPU Firmy Nvidia H100 (80 GB)

Obsługa funkcji

Premium Storage: obsługiwane
Buforowanie usługi Premium Storage: obsługiwane
Migracja na żywo: nieobsługiwana
Zachowywanie pamięci aktualizacji: nieobsługiwane
Maszyny wirtualne generacji 2: obsługiwane
Maszyny wirtualne generacji 1: nieobsługiwane
Przyspieszona sieć: obsługiwana
Efemeryczny dysk systemu operacyjnego: obsługiwany
Wirtualizacja zagnieżdżona: nieobsługiwana
Infiniband: obsługiwane

Ważne

Aby rozpocząć PRACĘ z maszynami wirtualnymi ND H100 v5, zapoznaj się z tematem Konfiguracja i optymalizacja obciążenia HPC, aby zapoznać się z krokami, takimi jak konfiguracja sterownika i sieci. Ze względu na zwiększoną ilość operacji we/wy pamięci procesora GPU, ND H100 v5 wymaga użycia maszyn wirtualnych generacji 2 i obrazów platformy handlowej.

pomoc techniczna platformy Azure s Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 i SLES 15 dla maszyn wirtualnych ND H100 v5. Obecnie obsługiwane są obrazy maszyn wirtualnych z systemem Ubuntu-HPC 20.4/22.04 i AlmaLinux-HPC 8.6/8.7.

Istnieją oferty zoptymalizowanych i wstępnie skonfigurowanych obrazów maszyn wirtualnych z systemem Linux dla obciążeń HPC/AI z zainstalowanymi różnymi narzędziami i bibliotekami HPC, dlatego są one zdecydowanie zalecane.

Aby pobrać obraz, przejdź do witryny Azure Marketplace.

Rozmiary w serii

Procesory wirtualne (Qty.) i Pamięć dla każdego rozmiaru

Nazwa rozmiaru procesory wirtualne (Qty).) Pamięć (GB)
Standard_ND96isr_H100_v5 96 1900

Zasoby podstawowe maszyny wirtualnej

Inne informacje o rozmiarze

Lista wszystkich dostępnych rozmiarów: rozmiary

Kalkulator cen: Kalkulator cen

Informacje o typach dysków: Typy dysków

Następne kroki

Dowiedz się więcej o tym, jak jednostki obliczeniowe platformy Azure (ACU) mogą ułatwić porównanie wydajności obliczeń w jednostkach SKU platformy Azure.

Zapoznaj się z usługą Azure Dedicated Hosts dla serwerów fizycznych, które mogą hostować co najmniej jedną maszynę wirtualną przypisaną do jednej subskrypcji platformy Azure.

Dowiedz się, jak monitorować maszyny wirtualne platformy Azure.