Serie rozmiarów ND-H100-v5
Maszyna wirtualna z serii ND H100 v5 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Ta seria jest przeznaczona do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanego ze skalowaniem w górę i skalowalnego w poziomie obciążeń sztucznej inteligencji i HPC.
Seria ND H100 v5 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA H100 Tensor Core. Wdrożenia oparte na ND H100 v5 mogą być skalowane w górę do tysięcy procesorów GPU z 3,2 Tb/s przepustowości połączenia międzylokacyjnej na maszynę wirtualną. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Quantum-2 CX7 InfiniBand o pojemności 400 Gb/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych i obsługują funkcję RDMA bezpośredniego procesora GPU.
Każdy procesor GPU oferuje łączność NVLINK 4.0 na potrzeby komunikacji na maszynie wirtualnej, a wystąpienie ma 96 rdzeni procesora Intel Xeon Scalable 96 generacji.
Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotekach komunikacyjnych NCCL firmy NVIDIA na potrzeby bezproblemowego klastrowania procesorów GPU.
Specyfikacje hosta
Element | Ilość Liczba jednostek |
Specyfikacje Identyfikator jednostki SKU, jednostki wydajności itp. |
---|---|---|
Procesor | 96 procesorów wirtualnych | Intel Xeon (Sapphire Rapids) [x86-64] |
Pamięć | 1900 GiB | |
Magazyn lokalny | 1 Dysk | 28000 GiB |
Magazyn zdalny | 32Disks | |
Sieć | 8 kart sieciowych | |
Akceleratory | 8 procesorów GPU | Procesor GPU Firmy Nvidia H100 (80 GB) |
Obsługa funkcji
Premium Storage: obsługiwane
Buforowanie usługi Premium Storage: obsługiwane
Migracja na żywo: nieobsługiwana
Zachowywanie pamięci aktualizacji: nieobsługiwane
Maszyny wirtualne generacji 2: obsługiwane
Maszyny wirtualne generacji 1: nieobsługiwane
Przyspieszona sieć: obsługiwana
Efemeryczny dysk systemu operacyjnego: obsługiwany
Wirtualizacja zagnieżdżona: nieobsługiwana
Infiniband: obsługiwane
Ważne
Aby rozpocząć PRACĘ z maszynami wirtualnymi ND H100 v5, zapoznaj się z tematem Konfiguracja i optymalizacja obciążenia HPC, aby zapoznać się z krokami, takimi jak konfiguracja sterownika i sieci. Ze względu na zwiększoną ilość operacji we/wy pamięci procesora GPU, ND H100 v5 wymaga użycia maszyn wirtualnych generacji 2 i obrazów platformy handlowej.
pomoc techniczna platformy Azure s Ubuntu 20.04/22.04, RHEL 7.9/8.7/9.3, AlmaLinux 8.8/9.2 i SLES 15 dla maszyn wirtualnych ND H100 v5. Obecnie obsługiwane są obrazy maszyn wirtualnych z systemem Ubuntu-HPC 20.4/22.04 i AlmaLinux-HPC 8.6/8.7.
Istnieją oferty zoptymalizowanych i wstępnie skonfigurowanych obrazów maszyn wirtualnych z systemem Linux dla obciążeń HPC/AI z zainstalowanymi różnymi narzędziami i bibliotekami HPC, dlatego są one zdecydowanie zalecane.
Aby pobrać obraz, przejdź do witryny Azure Marketplace.
Rozmiary w serii
Procesory wirtualne (Qty.) i Pamięć dla każdego rozmiaru
Nazwa rozmiaru | procesory wirtualne (Qty).) | Pamięć (GB) |
---|---|---|
Standard_ND96isr_H100_v5 | 96 | 1900 |
Zasoby podstawowe maszyny wirtualnej
Inne informacje o rozmiarze
Lista wszystkich dostępnych rozmiarów: rozmiary
Kalkulator cen: Kalkulator cen
Informacje o typach dysków: Typy dysków
Następne kroki
Dowiedz się więcej o tym, jak jednostki obliczeniowe platformy Azure (ACU) mogą ułatwić porównanie wydajności obliczeń w jednostkach SKU platformy Azure.
Zapoznaj się z usługą Azure Dedicated Hosts dla serwerów fizycznych, które mogą hostować co najmniej jedną maszynę wirtualną przypisaną do jednej subskrypcji platformy Azure.
Dowiedz się, jak monitorować maszyny wirtualne platformy Azure.