次の方法で共有


Windows 用の NVIDIA GPU ドライバー拡張機能

Windows 用 NVIDIA GPU ドライバー拡張機能は、Windows N シリーズ仮想マシン (VM) に NVIDIA GPU ドライバーをインストールします。 VM ファミリに応じて、この拡張機能では CUDA ドライバーまたは GRID ドライバーがインストールされます。 この拡張機能を使用して NVIDIA ドライバーをインストールする場合、NVIDIA のエンドユーザー使用許諾契約書の条項を受け入れ、同意します。 インストール プロセス中に、ドライバーのセットアップを完了するために仮想マシンが再起動することがあります。

ドライバーの手動インストールの手順と、現在サポートされているバージョンの一覧を確認できます。 詳細については、「Windows を実行している N シリーズ VM に NVIDIA GPU ドライバーをインストールする」を参照してください。

NVIDIA GPU ドライバー拡張機能は、Linux N シリーズ VM にもデプロイできます。 詳細については、「Linux 用の NVIDIA GPU ドライバー拡張機能」を参照してください。

Note

GPU ドライバーの拡張機能をインストールした後、ドライバーは拡張機能によって自動的に更新されません。 新しいバージョンのドライバーに移行する必要がある場合は、手動でドライバーをダウンロードしてインストールするか、拡張機能を削除して再度追加してください。

前提条件

仮想マシンが NVIDIA GPU ドライバー拡張機能を使用するための前提条件を満たしていることを確認します。

オペレーティング システムのサポート

NVIDIA GPU ドライバー拡張機能は、次の Windows バージョンをサポートしています。

Distribution Version
Windows 11 コア
Windows 10 コア
Windows Server 2022 コア
Windows Server 2019 コア
Windows Server 2016 コア
Windows Server 2012 R2 コア

インターネット接続が必要

NVIDIA GPU ドライバー拡張機能では、ターゲット VM がインターネットに接続され、アクセスできるようになっている必要があります。

拡張機能スキーマを確認する

次の JSON スニペットは、拡張機能のスキーマを示しています。

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

プロパティ

JSON スキーマには、次のパラメーターの値が含まれます。

名前 値/例 データ型
apiVersion 2015-06-15 date
publisher Microsoft.HpcCompute string
type NvidiaGpuDriverWindows string
typeHandlerVersion 1.4 INT

拡張機能のデプロイ

Azure VM 拡張機能は、Azure CLI、PowerShell、Azure Resource Manager (ARM)テンプレート、Azure Portal を使って管理できます。

注意

次の一部の例では、コマンドでパラメーター値 <placeholder> を使用します。 各コマンドを実行する前に、プレースホルダーの値を、実際の構成の特定値に置き換えてください。

Azure portal

Azure portal で NVIDIA GPU ドライバー拡張機能をインストールするには、次の手順に従います。

  1. Azure portal で、拡張機能をインストールする先の仮想マシンに移動します。

  2. [設定][拡張機能とアプリケーション] を選択します。

    Azure portal のスクリーンショット。仮想マシンの [拡張機能とアプリケーション] を選択する方法が示されています。

  3. [拡張機能][+ 追加] を選択します。

    Azure portal のスクリーンショット。仮想マシンの拡張機能を追加する方法が示されています。

  4. [NVIDIA GPU Driver Extension] (NVIDIA GPU ドライバー拡張機能) を見つけて選択し、[次へ] を選択します。

    Azure portal のスクリーンショット。仮想マシン用の NVIDIA GPU ドライバー拡張機能を見つけて選択する方法が示されています。

  5. [Review + create](レビュー + 作成) を選択します。 デプロイ アクションを確認し、[作成] を選択します。

    拡張機能がデプロイされるまで数分待ちます。

    Azure portal のスクリーンショット。選択した仮想マシンで NVIDIA GPU ドライバー拡張機能を作成する方法が示されています。

  6. この拡張機能が仮想マシンのインストール済み拡張機能として一覧表示されていることを確認します。

    Azure portal のスクリーンショット。仮想マシンの拡張機能の一覧に NVIDIA GPU ドライバー拡張機能が表示されています。

ARM テンプレート

ARM テンプレートは、デプロイ後に構成が必要な仮想マシンを 1 つ以上デプロイする場合に最適です。

仮想マシン拡張機能の JSON 構成は、仮想マシン リソース内に入れ子にすることも、JSON ARM テンプレートのルートまたは最上位レベルに配置することもできます。 JSON 構成の配置は、リソースの nametype の値に影響します。 詳細については、子リソースの名前と種類の設定に関する記事を参照してください。

次の例では、拡張機能が仮想マシン リソース内で入れ子になっていることを前提としています。 拡張機能リソースが入れ子になっていると、JSON は仮想マシンの "resources": [] オブジェクトに配置されます。

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "location": "[<resourceGroup().location>]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.4",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

次の PowerShell コマンドを使用して、NVIDIA GPU ドライバー拡張機能を仮想マシンにデプロイします。

Set-AzVMExtension
    -ResourceGroupName "<myResourceGroup>" `
    -VMName "<myVM>" `
    -Location "<location>" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverWindows" `
    -ExtensionType "NvidiaGpuDriverWindows" `
    -TypeHandlerVersion 1.4 `
    -SettingString '{ `
	}'

Azure CLI

Azure CLI で次のコマンドを実行して、NVIDIA GPU ドライバー拡張機能を仮想マシンにデプロイします。

az vm extension set \
  --resource-group <myResourceGroup> \
  --vm-name <myVM> \
  --name NvidiaGpuDriverWindows \
  --publisher Microsoft.HpcCompute \
  --version 1.4 \
  --settings '{ \
  }'

問題のトラブルシューティング

デプロイの問題のトラブルシューティング方法に関する推奨事項を次にいくつか示します。

拡張機能の状態を確認する

Azure portal で、あるいは PowerShell または Azure CLI を使用して、拡張機能のデプロイの状態を確認します。

特定の VM の拡張機能のデプロイ状態を確認するには、次のコマンドを実行します。

Get-AzVMExtension -ResourceGroupName <myResourceGroup> -VMName <myVM> -Name <myExtensionName>
az vm extension list --resource-group <myResourceGroup> --vm-name <myVM> -o table

出力ログを確認する

C:\WindowsAzure\Logs\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\ で、NVIDIA GPU ドライバー拡張機能のデプロイの出力ログを確認します。

エラー コードに対処する

次の表に、デプロイの一般的なエラー コードと、実行可能なフェローアップ アクションを示します。

エラー 説明 アクション
0 操作に成功しました。 アクションは不要です。
1 操作に成功しました。 再起動します。
100 操作はサポートされていないか、完了できませんでした。 ログ ファイルを確認して、エラーの原因を特定します。次に例を示します。
- PowerShell バージョンがサポートされていない。
- VM サイズが N シリーズ VM ではない。
- データのダウンロード中にエラーが発生した。
240、840 操作がタイムアウトしました。 操作を再試行します。
-1 例外が発生しました。 ログ ファイルを確認して、例外の原因を特定します。
-5x 保留中の再起動により操作が中断されました。 VM を再起動してください。 インストールは再起動後に続行されます。
アンインストールは手動で行う必要があります。

既知の問題

GRID ドライバー バージョン 17.x は、NVv3 (NVIDIA Tesla M60) とは互換性がありません。 バージョン 16.5 までの GRID ドライバーは、サポートされています。 NvidiaGpuDriverWindows により、NVv3 SKU に互換性のない最新のドライバーがインストールされます。 代わりに、次のランタイム設定を使用して、古いバージョンのドライバーを拡張機能により強制的にインストールします。 ドライバーのバージョンの詳細については、NVIDIA GPU の参照資料をご覧ください。

az vm extension set  --resource-group <rg-name> --vm-name <vm-name>  --name NvidiaGpuDriverWindows --publisher Microsoft.HpcCompute --settings "{'driverVersion':'538.46'}"
{
  "name": "NvidiaGpuDriverWindows",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.9",
    "autoUpgradeMinorVersion": true,
    "settings": {
         "driverVersion": "538.46"
    }
  }
}

サポートを受ける

デプロイの問題の解決に役立つその他のオプションを次に示します。

  • 支援が必要な場合は、Q&A および Stack Overflow のフォーラムで Azure エキスパートに問い合わせてください。

  • サイトに回答が見つからない場合は、質問を投稿して、Microsoft またはコミュニティの他のメンバーからの回答を得られます。

  • Microsoft サポートにお問い合わせいただくこともできます。 Azure サポートの使用方法の詳細については、Azure サポートに関する FAQ を参照してください。

次のステップ