Maszyna wirtualna z serii ND A100 w wersji 4 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Te rozmiary są przeznaczone do trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanych obciążeń HPC skalowanych w górę i skalowanych w poziomie.
Seria ND A100 v4 rozpoczyna się od jednej maszyny wirtualnej i ośmiu procesorów GPU NVIDIA Ampere A100 40 GB Tensor Core. Wdrożenia oparte na systemie ND A100 w wersji 4 mogą być skalowane w górę do tysięcy procesorów GPU z przepustowością połączenia wzajemnego na maszynę wirtualną o pojemności 1,6 TB/s. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Mellanox HDR InfiniBand o pojemności 200 GB/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych platformy Azure i obsługują funkcję RDMA bezpośredniego procesora GPU.
Każdy procesor GPU oferuje łączność NVLINK 3.0 na potrzeby komunikacji na maszynie wirtualnej z 96 fizycznymi rdzeniami procesora AMD Epyc™ 7V12 (Rzym) 96. generacji.
Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch, Caffe, RAPIDS i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotekach komunikacyjnych NCCL2 firmy NVIDIA na potrzeby bezproblemowego klastrowania procesorów GPU.
Specyfikacje hosta
Element
Ilość Liczba jednostek
Specyfikacje Identyfikator jednostki SKU, jednostki wydajności itp.
1Szybkość dysku tymczasowego często różni się między operacjami RR (odczyt losowy) i RW (losowy zapis). Operacje RR są zwykle szybsze niż operacje RW. Prędkość RW jest zwykle wolniejsza niż prędkość RR w serii, w której jest wymieniona tylko wartość prędkości RR.
Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). Podczas porównywania dysków mierzonych w GB (1000^3 bajtów) z dyskami mierzonymi w GiB (1024^3) pamiętaj, że liczby pojemności podane w GiB mogą wydawać się mniejsze. Na przykład 1023 GiB = 1098,4 GB.
Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.
Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz Wydajność maszyny wirtualnej i dysku.
Informacje o magazynie zdalnym (bez buforowania) dla każdego rozmiaru
1Niektóre rozmiary obsługują zwiększanie szybkości, aby tymczasowo zwiększyć wydajność dysku. Szybkość serii może być utrzymywana przez maksymalnie 30 minut naraz.
Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). Podczas porównywania dysków mierzonych w GB (1000^3 bajtów) z dyskami mierzonymi w GiB (1024^3) pamiętaj, że liczby pojemności podane w GiB mogą wydawać się mniejsze. Na przykład 1023 GiB = 1098,4 GB.
Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.
Dyski danych mogą działać w trybie buforowanym lub niebuforowanym. Dla pracy dysku danych w trybie buforowanym tryb pamięci podręcznej hosta jest ustawiony na wartość ReadOnly lub ReadWrite. Dla pracy dysku danych bez buforowania tryb pamięci podręcznej hosta jest ustawiony na wartość None.
Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz Wydajność maszyny wirtualnej i dysku.
Informacje o interfejsie sieciowym dla każdego rozmiaru
Oczekiwana przepustowość sieci to maksymalna zagregowana przepustowość przydzielona na typ maszyny wirtualnej dla wszystkich kart sieciowych dla wszystkich miejsc docelowych. Aby uzyskać więcej informacji, zobacz Przepustowość sieci maszyny wirtualnej
Górne limity nie są gwarantowane. Wskazówki dotyczące ofert limitów dotyczące wybierania odpowiedniego typu maszyny wirtualnej dla zamierzonej aplikacji. Rzeczywista wydajność sieci zależy od kilku czynników, w tym przeciążenia sieci, obciążeń aplikacji i ustawień sieci. Aby uzyskać informacje na temat optymalizowania przepływności sieci, zobacz Optymalizowanie przepływności sieci dla maszyn wirtualnych platformy Azure.
Aby osiągnąć oczekiwaną wydajność sieci w systemie Linux lub Windows, może być konieczne wybranie określonej wersji lub zoptymalizowanie maszyny wirtualnej. Aby uzyskać więcej informacji, zobacz Testowanie przepustowości/przepływności (NTTTCP).
Informacje o akceleratorze (procesory GPU, układy FPGA itp.) dla każdego rozmiaru
Zapoznaj się z usługą Azure Dedicated Hosts dla serwerów fizycznych, które mogą hostować co najmniej jedną maszynę wirtualną przypisaną do jednej subskrypcji platformy Azure.