共用方式為


適用於 Windows 的 NVIDIA GPU 驅動程式擴充功能

適用於 Windows 的 NVIDIA GPU 驅動程式擴充功能會在 Windows N 系列虛擬機器 (VM) 上安裝 NVIDIA GPU 驅動程式。 視虛擬機器系列而定,擴充功能會安裝 CUDA 或 GRID 驅動程式。 若您使用此延伸模組安裝 NVIDIA 驅動程式,即表示您接受並同意 NVIDIA End-User License Agreement (NVIDIA 使用者授權合約) 的條款。 在安裝過程中,VM 可能會重新開機以便完成驅動程式設定。

手動安裝驅動程式的指示,以及目前支援的版本清單可供檢閱。 如需詳細資訊,請參閱在執行 Windows 的 N 系列 VM 上安裝 NVIDIA GPU 驅動程式

NVIDIA GPU 驅動程式擴充功能也可以在 Linux N 系列 VM 上部署。 如需詳細資訊,請參閱適用於 Linux 的 Nvidia GPU 驅動程式延伸模組

注意

安裝延伸模組之後,GPU 驅動程式延伸模組不會自動更新驅動程式。 如果您需要移至較新的驅動程式版本,請手動下載並安裝驅動程式,或移除並再次新增延伸模組。

必要條件

確認虛擬機器符合使用 NVIDIA GPU 驅動程式擴充功能的必要條件。

作業系統支援

NVIDIA GPU 驅動程式擴充功能支援下列 Windows 版本:

Distribution 版本
Windows 11 核心
Windows 10 核心
Windows Server 2022 核心
Windows Server 2019 核心
Windows Server 2016 核心
Windows Server 2012 R2 核心

需要網際網路連線

NVIDIA GPU 驅動程式擴充功能要求目標 VM 已連線到網際網路並具有存取權。

檢閱擴充功能架構

下列 JSON 程式碼片段會顯示延伸模組的結構描述:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

屬性

JSON 架構包含下列參數的值。

名稱 值/範例 資料類型
apiVersion 2015-06-15 date
publisher Microsoft.HpcCompute string
type NvidiaGpuDriverWindows string
typeHandlerVersion 1.4 int

部署延伸模組

您可以使用 Azure CLI、PowerShell、Azure Resource Manager (ARM) 範本及 Azure 入口網站來管理 Azure VM 延伸模組。

注意

下列部分範例會在命令中使用 <placeholder> 參數值。 執行每個命令之前,請務必以組態的特定值取代任何預留位置值。

Azure 入口網站

若要在 Azure 入口網站中安裝 NVIDIA GPU 驅動程式擴充功能,請遵循下列步驟:

  1. Azure 入口網站中,移至您要安裝擴充功能的虛擬機器。

  2. 在 [設定] 底下,選取 [延伸模組 + 應用程式]

    顯示如何在 Azure 入口網站 中選取虛擬機的 [擴充功能 + 應用程式] 的螢幕快照。

  3. 在 [延伸模組] 底下,選取 [+ 新增]。

    顯示如何在 Azure 入口網站 中新增虛擬機擴充功能的螢幕快照。

  4. 找出並選取 [NVIDIA GPU 驅動程式擴充功能],然後選取 [下一步]

    此螢幕快照顯示如何在 Azure 入口網站 中尋找並選取虛擬機的 NVIDIA GPU 驅動程式擴充功能。

  5. 選取 [檢閱 + 建立]。 確認部署動作,然後選取 [建立]

    請稍候幾分鐘以讓擴充功能進行部署。

    此螢幕快照顯示如何在 Azure 入口網站 中選取的虛擬機上建立 NVIDIA GPU 驅動程式擴充功能。

  6. 確認擴充功能已列為虛擬機器的已安裝擴充功能。

    此螢幕快照顯示 Azure 入口網站 中虛擬機擴充功能清單中的 NVIDIA GPU 驅動程式擴充功能。

ARM 範本

在部署一部或多部需要部署後設定的虛擬機器時,便很適合使用 ARM 範本。

虛擬機器延伸模組的 JSON 設定可以巢狀方式置於虛擬機器資源內部,或放在 JSON ARM 範本的根目錄或最上層。 JSON 設定的放置會影響資源 nametype 的值。 如需詳細資訊,請參閱設定子資源的名稱和類型

下列範例假設擴充功能以巢狀方式置於虛擬機器資源內部。 在以巢狀方式安置好延伸模組資源後,JSON 會放在虛擬機器的 "resources": [] 物件中。

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "location": "[<resourceGroup().location>]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

使用下列 PowerShell 命令,將 NVIDIA GPU 驅動程式擴充功能部署至虛擬機器。

Set-AzVMExtension
    -ResourceGroupName "<myResourceGroup>" `
    -VMName "<myVM>" `
    -Location "<location>" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverWindows" `
    -ExtensionType "NvidiaGpuDriverWindows" `
    -TypeHandlerVersion 1.4 `
    -SettingString '{ `
	}'

Azure CLI

在 Azure CLI 中執行下列命令,將 NVIDIA GPU 驅動程式擴充功能部署至虛擬機器。

az vm extension set \
  --resource-group <myResourceGroup> \
  --vm-name <myVM> \
  --name NvidiaGpuDriverWindows \
  --publisher Microsoft.HpcCompute \
  --version 1.4 \
  --settings '{ \
  }'

針對問題進行疑難排解

以下是如何針對部署問題進行疑難解答的一些建議。

檢查擴充功能狀態

在 Azure 入口網站中,或使用 PowerShell 或 Azure CLI 檢查擴充功能部署的狀態。

若要查看指定 VM 的擴充功能部署狀態,請執行下列命令:

Get-AzVMExtension -ResourceGroupName <myResourceGroup> -VMName <myVM> -Name <myExtensionName>
az vm extension list --resource-group <myResourceGroup> --vm-name <myVM> -o table

檢閱輸出記錄

C:\WindowsAzure\Logs\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\ 下檢視 NVIDIA GPU 驅動程式擴充功能部署的輸出記錄。

回應錯誤碼

下表列出部署的常見錯誤碼,以及可能的後續動作。

錯誤 描述 動作
0 作業成功。 不需要採取任何動作。
1 作業成功。 重新開機。
100 不支援或無法完成作業。 檢查記錄檔以判斷錯誤的原因,例如:
- 不支援 PowerShell 版本。
- VM 大小不是 N 系列 VM。
- 資料下載期間失敗。
240、840 作業逾時。 重試作業。
-1 發生例外狀況。 檢查記錄檔以判斷例外狀況的成因。
-5x 作業因重新開機擱置而中斷。 重新啟動 VM。 安裝會在重新啟動後繼續進行。
解除安裝應以手動方式叫用。

已知問題

GRID 驅動程式版本 17.x 在 NVv3 上不相容(NVIDIA Tesla M60)。 支援最高版本的 16.5 GRID 驅動程式。 NvidiaGpuDriverWindows 會安裝 NVv3 SKU 上不相容的最新驅動程式。 請改用下列運行時間設定來強制擴充功能安裝舊版的驅動程式。 如需驅動程式版本的詳細資訊,請參閱 NVIDIA GPU 資源

az vm extension set  --resource-group <rg-name> --vm-name <vm-name>  --name NvidiaGpuDriverWindows --publisher Microsoft.HpcCompute --settings "{'driverVersion':'538.46'}"
{
  "name": "NvidiaGpuDriverWindows",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.9",
    "autoUpgradeMinorVersion": true,
    "settings": {
         "driverVersion": "538.46"
    }
  }
}

取得支援

以下還有一些可協助您解決部署問題的其他選項:

下一步