Maszyny wirtualne procesora GPU dla urządzeń z procesorem GPU Pro w usłudze Azure Stack Edge
DOTYCZY: Azure Stack Edge Pro — GPUAzure Stack Edge Pro 2Azure Stack Edge Pro R
Obciążenia przyspieszone przez procesor GPU na urządzeniu gpu Pro usługi Azure Stack Edge wymagają maszyny wirtualnej z procesorem GPU (maszyna wirtualna). Ten artykuł zawiera omówienie maszyn wirtualnych procesora GPU, w tym obsługiwanych systemów operacyjnych, sterowników procesora GPU i rozmiarów maszyn wirtualnych. Omówiono również opcje wdrażania maszyn wirtualnych z procesorem GPU używanych z klastrami Kubernetes.
Informacje o maszynach wirtualnych procesora GPU
Urządzenia azure Stack Edge mogą być wyposażone w 1 lub 2 procesory GPU Firmy Nvidia Tesla T4 lub Tensor Core A2. Aby wdrożyć obciążenia maszyn wirtualnych przyspieszonych przez procesor GPU na tych urządzeniach, użyj rozmiarów maszyn wirtualnych zoptymalizowanych pod kątem procesora GPU. Wybrana maszyna wirtualna z procesorem GPU powinna być zgodna z procesorem GPU na urządzeniu Azure Stack Edge. Aby uzyskać więcej informacji, zobacz Obsługiwane maszyny wirtualne zoptymalizowane pod kątem procesorów GPU serii N.
Aby korzystać z możliwości procesora GPU maszyn wirtualnych serii N platformy Azure, należy zainstalować sterowniki procesora GPU firmy Nvidia. Rozszerzenie sterownika procesora GPU firmy Nvidia instaluje odpowiednie sterowniki Nvidia CUDA lub GRID. Rozszerzenia procesora GPU można zainstalować przy użyciu szablonów lub witryny Azure Portal.
Rozszerzenie można zainstalować i zarządzać nim przy użyciu szablonów usługi Azure Resource Manager po wdrożeniu maszyny wirtualnej. W witrynie Azure Portal można zainstalować rozszerzenie procesora GPU podczas wdrażania maszyny wirtualnej lub po jej wdrożeniu; Aby uzyskać instrukcje, zobacz Deploy GPU VMs on your Azure Stack Edge device (Wdrażanie maszyn wirtualnych procesora GPU na urządzeniu Azure Stack Edge).
Jeśli urządzenie ma skonfigurowany klaster Kubernetes, przed wdrożeniem maszyn wirtualnych procesora GPU zapoznaj się z zagadnieniami dotyczącymi wdrażania klastrów Kubernetes.
Obsługiwane sterowniki systemu operacyjnego i procesora GPU
Rozszerzenia sterowników procesora GPU firmy Nvidia dla systemów Windows i Linux obsługują następujące wersje systemu operacyjnego.
Obsługiwany system operacyjny dla rozszerzenia procesora GPU dla systemu Windows
To rozszerzenie obsługuje następujące systemy operacyjne. Inne wersje mogą działać, ale nie zostały przetestowane w firmie na maszynach wirtualnych z procesorem GPU uruchomionych na urządzeniach usługi Azure Stack Edge.
Dystrybucja | Wersja |
---|---|
Windows Server 2019 | Podstawowe funkcje |
Windows Server 2016 | Podstawowe funkcje |
Obsługiwany system operacyjny dla rozszerzenia procesora GPU dla systemu Linux
To rozszerzenie obsługuje następującą dystrybucję systemu operacyjnego, w zależności od obsługi sterowników dla określonej wersji systemu operacyjnego. Inne wersje mogą działać, ale nie zostały przetestowane w firmie na maszynach wirtualnych z procesorem GPU uruchomionych na urządzeniach usługi Azure Stack Edge.
Dystrybucja | Wersja |
---|---|
Red Hat Enterprise Linux | 7,4 |
Uwaga
Rozszerzenie procesora GPU systemu Ubuntu 18.04 LTS zostało uznane za przestarzałe. Rozszerzenie procesora GPU nie jest już obsługiwane na maszynach wirtualnych gpu z systemem Ubuntu 18.04 uruchomionych na urządzeniach usługi Azure Stack Edge. Jeśli planujesz korzystać z dystrybucji Ubuntu w wersji 18.04 LTS, zobacz kroki ręcznej instalacji sterownika procesora GPU w artykule CUDA Toolkit 12.1 Update 1 Pobrane pliki. Przed instalacją może być konieczne pobranie klucza podpisywania CUDA. Aby zapoznać się z przykładem instalowania klucza podpisywania, zobacz Rozwiązywanie problemów z rozszerzeniem procesora GPU dla maszyn wirtualnych z procesorem GPU w usłudze Azure Stack Edge Pro.
Wdrażanie maszyny wirtualnej z procesorem GPU
Maszynę wirtualną procesora GPU można wdrożyć za pośrednictwem witryny Azure Portal lub szablonów usługi Azure Resource Manager. Rozszerzenie procesora GPU jest instalowane po utworzeniu maszyny wirtualnej.
Portal: w witrynie Azure Portal można szybko zainstalować rozszerzenie procesora GPU podczas tworzenia maszyny wirtualnej lub po wdrożeniu maszyny wirtualnej.
Szablony: przy użyciu szablonów usługi Azure Resource Manager utworzysz maszynę wirtualną, a następnie zainstalujesz rozszerzenie procesora GPU.
Maszyny wirtualne procesora GPU i platforma Kubernetes
Przed wdrożeniem maszyn wirtualnych procesora GPU na urządzeniu zapoznaj się z poniższymi zagadnieniami, jeśli platforma Kubernetes jest skonfigurowana na urządzeniu.
W przypadku urządzenia z procesorem GPU 1:
Utwórz maszynę wirtualną procesora GPU, a następnie konfigurację platformy Kubernetes na urządzeniu: w tym scenariuszu tworzenie maszyny wirtualnej procesora GPU i konfiguracja platformy Kubernetes zakończy się powodzeniem. W tym przypadku platforma Kubernetes nie będzie miała dostępu do procesora GPU.
Skonfiguruj platformę Kubernetes na urządzeniu, a następnie utwórz maszynę wirtualną z procesorem GPU: w tym scenariuszu platforma Kubernetes twierdzi, że procesor GPU na urządzeniu i tworzenie maszyny wirtualnej zakończy się niepowodzeniem, ponieważ nie ma dostępnych zasobów procesora GPU.
W przypadku urządzenia z procesorem GPU 2
Utwórz maszynę wirtualną z procesorem GPU, a następnie konfigurację platformy Kubernetes na urządzeniu: w tym scenariuszu utworzona maszyna wirtualna z procesorem GPU będzie podawać jeden procesor GPU na urządzeniu, a konfiguracja platformy Kubernetes również zakończy się powodzeniem i będzie twierdziła, że pozostały jeden procesor GPU.
Utwórz dwie maszyny wirtualne procesora GPU, a następnie konfigurację platformy Kubernetes na urządzeniu: w tym scenariuszu dwie maszyny wirtualne gpu twierdzą, że dwa procesory GPU na urządzeniu i platforma Kubernetes została pomyślnie skonfigurowana bez procesorów GPU.
Skonfiguruj platformę Kubernetes na urządzeniu, a następnie utwórz maszynę wirtualną z procesorem GPU: w tym scenariuszu platforma Kubernetes twierdzi, że zarówno procesory GPU na urządzeniu, jak i tworzenie maszyny wirtualnej zakończy się niepowodzeniem, ponieważ nie są dostępne żadne zasoby procesora GPU.
Następne kroki
- Dowiedz się, jak wdrażać maszyny wirtualne procesora GPU.
- Dowiedz się, jak zainstalować rozszerzenie procesora GPU na maszynach wirtualnych procesora GPU uruchomionych na urządzeniu.