Maszyna wirtualna z serii ND MI300X v5 to nowy flagowy dodatek do rodziny procesorów GPU platformy Azure. Został zaprojektowany na potrzeby trenowania wysokiej klasy uczenia głębokiego i ściśle powiązanego ze skalowaniem w górę i skalowalnego w poziomie obciążeń sztucznej inteligencji i HPC.
Maszyna wirtualna z serii ND MI300X v5 rozpoczyna się od ośmiu procesorów GPU AMD Instinct MI300 i dwóch czwartych procesorów Intel Xeon Scalable 96 rdzeni fizycznych. Każdy procesor GPU na maszynie wirtualnej jest następnie połączony ze sobą za pośrednictwem linków 4th-Gen AMD Infinity Fabric z przepustowością 128 GB/s na procesor GPU i 896 GB/s zagregowanej przepustowości.
Wdrożenia oparte na protokole ND MI300X w wersji 5 mogą być skalowane w górę do tysięcy procesorów GPU z przepustowością połączenia wzajemnego na maszynę wirtualną o pojemności 3,2 TB/s. Każdy procesor GPU na maszynie wirtualnej jest dostarczany z własnym dedykowanym, niezależnym od topologii połączeniem NVIDIA Quantum-2 CX7 InfiniBand o pojemności 400 Gb/s. Te połączenia są automatycznie konfigurowane między maszynami wirtualnymi zajmującymi ten sam zestaw skalowania maszyn wirtualnych i obsługują funkcję GPUDirect RDMA.
Te wystąpienia zapewniają doskonałą wydajność dla wielu narzędzi sztucznej inteligencji, uczenia maszynowego i analizy, które obsługują przyspieszanie procesora GPU "out-of-the-box", takie jak TensorFlow, Pytorch i inne struktury. Ponadto połączenie infiniBand skalowane w poziomie obsługuje duży zestaw istniejących narzędzi sztucznej inteligencji i HPC opartych na bibliotece ROCm Communication Collectives Library (RCCL) firmy AMD w celu bezproblemowego klastrowania procesorów GPU.
Specyfikacje hosta
Element
Ilość
Liczba jednostek
Specyfikacje
Identyfikator jednostki SKU, jednostki wydajności itp.
1Szybkość dysku tymczasowego często różni się między operacjami RR (odczyt losowy) i RW (losowy zapis). Operacje RR są zwykle szybsze niż operacje RW. Prędkość RW jest zwykle wolniejsza niż prędkość RR w serii, w której jest wymieniona tylko wartość prędkości RR.
Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). Podczas porównywania dysków mierzonych w GB (1000^3 bajtów) z dyskami mierzonymi w GiB (1024^3) pamiętaj, że liczby pojemności podane w GiB mogą wydawać się mniejsze. Na przykład 1023 GiB = 1098,4 GB.
Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.
Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz Wydajność maszyny wirtualnej i dysku.
Informacje o magazynie zdalnym (bez buforowania) dla każdego rozmiaru
1Niektóre rozmiary obsługują zwiększanie szybkości, aby tymczasowo zwiększyć wydajność dysku. Szybkość serii może być utrzymywana przez maksymalnie 30 minut naraz.
Pojemność magazynu jest podawana w jednostkach GiB (1024^3 bajtów). Podczas porównywania dysków mierzonych w GB (1000^3 bajtów) z dyskami mierzonymi w GiB (1024^3) pamiętaj, że liczby pojemności podane w GiB mogą wydawać się mniejsze. Na przykład 1023 GiB = 1098,4 GB.
Przepływność dysku mierzona jest jako liczba operacji wejścia/wyjścia na sekundę i MB/s, gdzie 1 MB/s = 10^6 bajtów/s.
Dyski danych mogą działać w trybie buforowanym lub niebuforowanym. Dla pracy dysku danych w trybie buforowanym tryb pamięci podręcznej hosta jest ustawiony na wartość ReadOnly lub ReadWrite. Dla pracy dysku danych bez buforowania tryb pamięci podręcznej hosta jest ustawiony na wartość None.
Aby dowiedzieć się, jak uzyskać najlepszą wydajność magazynu dla maszyn wirtualnych, zobacz Wydajność maszyny wirtualnej i dysku.
Informacje o interfejsie sieciowym dla każdego rozmiaru
Oczekiwana przepustowość sieci to maksymalna zagregowana przepustowość przydzielona na typ maszyny wirtualnej dla wszystkich kart sieciowych dla wszystkich miejsc docelowych. Aby uzyskać więcej informacji, zobacz Przepustowość sieci maszyny wirtualnej
Górne limity nie są gwarantowane. Wskazówki dotyczące ofert limitów dotyczące wybierania odpowiedniego typu maszyny wirtualnej dla zamierzonej aplikacji. Rzeczywista wydajność sieci zależy od kilku czynników, w tym przeciążenia sieci, obciążeń aplikacji i ustawień sieci. Aby uzyskać informacje na temat optymalizowania przepływności sieci, zobacz Optymalizowanie przepływności sieci dla maszyn wirtualnych platformy Azure.
Aby osiągnąć oczekiwaną wydajność sieci w systemie Linux lub Windows, może być konieczne wybranie określonej wersji lub zoptymalizowanie maszyny wirtualnej. Aby uzyskać więcej informacji, zobacz Testowanie przepustowości/przepływności (NTTTCP).
Informacje o akceleratorze (procesory GPU, układy FPGA itp.) dla każdego rozmiaru