Udostępnij za pośrednictwem


Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Windows

Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Windows instaluje sterowniki procesora GPU NVIDIA na maszynach wirtualnych z serii N systemu Windows. W zależności od rodziny maszyn wirtualnych rozszerzenie instaluje sterowniki CUDA lub GRID. Podczas instalowania sterowników FIRMY NVIDIA przy użyciu tego rozszerzenia akceptujesz i wyrażasz zgodę na warunki umowy licencyjnej użytkownika końcowego firmy NVIDIA. Podczas procesu instalacji maszyna wirtualna może zostać ponownie uruchomiona, aby ukończyć konfigurację sterownika.

Instrukcje dotyczące ręcznej instalacji sterowników oraz lista bieżących obsługiwanych wersji jest dostępna do przejrzenia. Aby uzyskać więcej informacji, zobacz Instalowanie sterowników procesora GPU NVIDIA na maszynach wirtualnych serii N z systemem Windows.

Rozszerzenie sterownika procesora GPU firmy NVIDIA można również wdrożyć na maszynach wirtualnych serii N z systemem Linux. Aby uzyskać więcej informacji, zobacz Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Linux.

Uwaga

Rozszerzenia sterowników procesora GPU nie aktualizują automatycznie sterownika po zainstalowaniu rozszerzenia. Jeśli musisz przejść do nowszej wersji sterownika, pobierz ręcznie i zainstaluj sterownik lub usuń i ponownie dodaj rozszerzenie.

Wymagania wstępne

Upewnij się, że maszyna wirtualna spełnia wymagania wstępne dotyczące korzystania z rozszerzenia sterownika procesora GPU firmy NVIDIA.

Obsługa systemów operacyjnych

Rozszerzenie sterownika procesora GPU firmy NVIDIA obsługuje następujące wersje systemu Windows:

Dystrybucja Wersja
Windows 11 Podstawowe funkcje
Windows 10 Podstawowe funkcje
Windows Server 2022 Podstawowe funkcje
Windows Server 2019 Podstawowe funkcje
Windows Server 2016 Podstawowe funkcje
Windows Server 2012 R2 Podstawowe funkcje

Wymagane jest połączenie internetowe

Rozszerzenie sterownika procesora GPU firmy NVIDIA wymaga, aby docelowa maszyna wirtualna została połączona z Internetem i ma dostęp.

Przeglądanie schematu rozszerzenia

Poniższy fragment kodu JSON przedstawia schemat rozszerzenia:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Właściwości

Schemat JSON zawiera wartości dla następujących parametrów.

Nazwisko Wartość/przykład Typ danych
apiVersion 2015-06-15 data
publisher Microsoft.HpcCompute string
type NvidiaGpuDriverWindows string
typeHandlerVersion 1.4 int

Wdrażanie rozszerzenia

Rozszerzenia maszyn wirtualnych platformy Azure można zarządzać przy użyciu interfejsu wiersza polecenia platformy Azure, programu PowerShell, szablonów usługi Azure Resource Manager (ARM) i witryny Azure Portal.

Uwaga

Niektóre z poniższych przykładów używają <placeholder> wartości parametrów w poleceniach. Przed uruchomieniem każdego polecenia pamiętaj, aby zastąpić wszystkie wartości symboli zastępczych określonymi wartościami konfiguracji.

Azure Portal

Aby zainstalować rozszerzenie sterownika procesora GPU firmy NVIDIA w witrynie Azure Portal, wykonaj następujące kroki:

  1. W witrynie Azure Portal przejdź do maszyny wirtualnej, na której chcesz zainstalować rozszerzenie.

  2. W obszarze Ustawienia wybierz pozycję Rozszerzenia i aplikacje.

    Zrzut ekranu przedstawiający sposób wybierania pozycji Rozszerzenia i aplikacje dla maszyny wirtualnej w witrynie Azure Portal.

  3. W obszarze Rozszerzenia wybierz pozycję + Dodaj.

    Zrzut ekranu przedstawiający sposób dodawania rozszerzenia dla maszyny wirtualnej w witrynie Azure Portal.

  4. Znajdź i wybierz pozycję Rozszerzenie sterownika procesora GPU firmy NVIDIA, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający sposób lokalizowania i wybierania rozszerzenia sterownika procesora GPU FIRMY NVIDIA dla maszyny wirtualnej w witrynie Azure Portal.

  5. Wybierz pozycję Przejrzyj i utwórz. Potwierdź akcję wdrożenia i wybierz pozycję Utwórz.

    Poczekaj kilka minut na wdrożenie rozszerzenia.

    Zrzut ekranu przedstawiający sposób tworzenia rozszerzenia sterownika procesora GPU FIRMY NVIDIA na wybranej maszynie wirtualnej w witrynie Azure Portal.

  6. Upewnij się, że rozszerzenie jest wyświetlane jako zainstalowane rozszerzenie dla maszyny wirtualnej.

    Zrzut ekranu przedstawiający rozszerzenie sterownika procesora GPU firmy NVIDIA na liście rozszerzeń maszyny wirtualnej w witrynie Azure Portal.

Szablon ARM

Szablony usługi ARM są idealne podczas wdrażania co najmniej jednej maszyny wirtualnej wymagającej konfiguracji po wdrożeniu.

Konfiguracja JSON rozszerzenia maszyny wirtualnej może być zagnieżdżona wewnątrz zasobu maszyny wirtualnej lub umieszczona na poziomie głównym lub najwyższym szablonu usługi ARM JSON. Umieszczanie konfiguracji JSON wpływa na wartość zasobu name i type. Aby uzyskać więcej informacji, zobacz Ustawianie nazwy i typu dla zasobów podrzędnych.

W poniższym przykładzie założono, że rozszerzenie jest zagnieżdżone wewnątrz zasobu maszyny wirtualnej. Po zagnieżdżeniu zasobu rozszerzenia kod JSON jest umieszczany w "resources": [] obiekcie maszyny wirtualnej.

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "location": "[<resourceGroup().location>]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Użyj następującego polecenia programu PowerShell, aby wdrożyć rozszerzenie sterownika procesora GPU FIRMY NVIDIA na maszynie wirtualnej.

Set-AzVMExtension
    -ResourceGroupName "<myResourceGroup>" `
    -VMName "<myVM>" `
    -Location "<location>" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverWindows" `
    -ExtensionType "NvidiaGpuDriverWindows" `
    -TypeHandlerVersion 1.4 `
    -SettingString '{ `
	}'

Interfejs wiersza polecenia platformy Azure

Uruchom następujące polecenie w interfejsie wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie sterownika procesora GPU firmy NVIDIA na maszynie wirtualnej.

az vm extension set \
  --resource-group <myResourceGroup> \
  --vm-name <myVM> \
  --name NvidiaGpuDriverWindows \
  --publisher Microsoft.HpcCompute \
  --version 1.4 \
  --settings '{ \
  }'

Rozwiązywanie problemów

Poniżej przedstawiono kilka sugestii dotyczących rozwiązywania problemów z wdrażaniem.

Sprawdzanie stanu rozszerzenia

Sprawdź stan wdrożenia rozszerzenia w witrynie Azure Portal lub przy użyciu programu PowerShell lub interfejsu wiersza polecenia platformy Azure.

Aby wyświetlić stan wdrożenia rozszerzeń dla danej maszyny wirtualnej, uruchom następujące polecenia:

Get-AzVMExtension -ResourceGroupName <myResourceGroup> -VMName <myVM> -Name <myExtensionName>
az vm extension list --resource-group <myResourceGroup> --vm-name <myVM> -o table

Przeglądanie dzienników wyjściowych

Wyświetl dzienniki wyjściowe wdrożenia rozszerzenia sterownika procesora GPU firmy NVIDIA w obszarze C:\WindowsAzure\Logs\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\.

Odpowiadanie na kody błędów

Poniższa tabela zawiera listę typowych kodów błędów dotyczących wdrażania i potencjalnych działań następczych.

Błąd opis Akcja
0 Operacja powiodła się. Brak wymaganej akcji.
1 Operacja powiodła się. Ponowny rozruch.
100 Operacja nie jest obsługiwana lub nie można jej ukończyć. Sprawdź pliki dziennika, aby określić przyczynę błędu, na przykład:
— Wersja programu PowerShell nie jest obsługiwana.
— Rozmiar maszyny wirtualnej nie jest maszyną wirtualną serii N.
— Błąd podczas pobierania danych.
240, 840 Limit czasu operacji. Ponów próbę wykonania operacji.
-1 Wystąpił wyjątek. Sprawdź pliki dziennika, aby określić przyczynę wyjątku.
-5x Operacja została przerwana z powodu oczekującego ponownego uruchomienia. Uruchom ponownie maszynę wirtualną. Instalacja jest kontynuowana po ponownym uruchomieniu.
Odinstalowanie powinno być wywoływane ręcznie.

Znane problemy

Wersja 17.x sterownika GRID jest niezgodna w systemie NVv3 (NVIDIA Tesla M60). Obsługiwane są sterowniki GRID do wersji 16.5 . NvidiaGpuDriverWindows instaluje najnowsze sterowniki, które są niezgodne w jednostce SKU NVv3. Zamiast tego użyj następujących ustawień środowiska uruchomieniowego, aby wymusić zainstalowanie starszej wersji sterownika. Aby uzyskać więcej informacji na temat wersji sterowników, zobacz Zasoby procesora GPU firmy NVIDIA.

az vm extension set  --resource-group <rg-name> --vm-name <vm-name>  --name NvidiaGpuDriverWindows --publisher Microsoft.HpcCompute --settings "{'driverVersion':'538.46'}"
{
  "name": "NvidiaGpuDriverWindows",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.9",
    "autoUpgradeMinorVersion": true,
    "settings": {
         "driverVersion": "538.46"
    }
  }
}

Uzyskiwanie pomocy technicznej

Poniżej przedstawiono kilka innych opcji, które ułatwiają rozwiązywanie problemów z wdrażaniem:

  • Aby uzyskać pomoc, skontaktuj się z ekspertami platformy Azure na forach Q&A i Stack Overflow.

  • Jeśli nie znajdziesz odpowiedzi w witrynie, możesz opublikować pytanie dotyczące danych wejściowych od firmy Microsoft lub innych członków społeczności.

  • Możesz również skontaktować się z pomoc techniczna firmy Microsoft. Aby uzyskać informacje na temat korzystania z pomoc techniczna platformy Azure, przeczytaj często zadawane pytania dotyczące pomoc techniczna platformy Azure.

Następne kroki