クラスター化された VM で GPU を使用する

[アーティクル]
10/25/2024
適用対象:

✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Local, versions 23H2 and 22H2

適用対象: Azure Local バージョン 23H2 および 22H2

Note

Azure Local バージョン 23H2 で VM を作成および管理するには、 Azure Arc コントロールプレーンを使用することをお勧めします。 Azure Arc VM で使用できない機能が必要な場合のみ、以下で説明するメカニズムを使用して VM を管理します。

クラスターに GPU を含めると、クラスター化された VM で実行されているワークロードに GPU アクセラレーションを提供できます。 GPU アクセラレーションは、1 つ以上の物理 GPU を VM 割り当てることができる Discrete Device Assignment (DDA) または GPU パーティショニングによって提供できます。クラスター化された VM では、GPU アクセラレーションと、フェールオーバーによる高可用性などのクラスタリング機能を利用できます。仮想マシン (VM) のライブマイグレーションは現在サポートされていませんが、障害が発生した場合は、VM を自動的に再起動して GPU リソースが使用可能な場所に配置できます。

この記事では、クラスター化された VM で GPU (グラフィックス処理装置) を使用し、Discrete Device Assignment によってワークロードに GPU アクセラレーションを提供する方法について説明します。この記事では、クラスターの準備、クラスター VM への GPU の割り当て、Windows Admin Center と PowerShell を使用してその VM をフェールオーバーする方法について説明します。

前提条件

クラスター化された VM を備えた GPU の使用を開始する前に、考慮すべき要件と事項がいくつかあります。

Azure Stack HCI バージョン 22H2 以降を実行する Azure Stack HCI クラスターが必要です。

Windows Server 2025 以降を実行する Windows Server フェールオーバークラスターが必要です。

クラスター内のすべてのサーバーに、同じメーカー、同じモデルの GPU をインストールする必要があります。
GPU 製造元の指示を確認し、それに従い、クラスター内の各サーバーに必要なドライバーとソフトウェアをインストールします。
ハードウェアベンダーによっては、GPU ライセンス要件の構成も必要な場合があります。
Windows Admin Center がインストールされているマシンが必要です。このマシンは、クラスターノードの 1 つである場合があります。

GPU を割り当てる VM を作成します。「Discrete Device Assignment を使用したグラフィックデバイスのデプロイ」の指示に従って、キャッシュ動作、停止アクション、およびメモリマップ I/O (MMIO) プロパティを設定し、VM を DDA 用に準備します。
各サーバーにセキュリティ対策ドライバーをインストールし、GPU を無効にしたうえで、ホストからマウント解除して、各サーバーの GPU を準備します。このプロセスの詳細については、「Discrete Device Assignment を使用したグラフィックスデバイスのデプロイ」を参照してください。

クラスター内で GPU デバイスを準備するには、「個別のデバイスの割り当てを使用したデバイスのデプロイの計画」に記載されている手順を実行します
VM で十分な MMIO スペースがデバイスに割り当てられていることを確認します。詳しくは、「名前空間」を参照してください。
GPU を割り当てる VM を作成します。「Discrete Device Assignment を使用したグラフィックデバイスのデプロイ」の指示に従って、キャッシュ動作、停止アクション、およびメモリマップ I/O (MMIO) プロパティを設定し、VM を DDA 用に準備します。
各サーバーにセキュリティ対策ドライバーをインストールし、GPU を無効にしたうえで、ホストからマウント解除して、各サーバーの GPU を準備します。このプロセスの詳細については、「Discrete Device Assignment を使用したグラフィックスデバイスのデプロイ」を参照してください。

Note

GPU をサポートする Azure Stack HCI ソリューションがシステムでサポートされている必要があります。オプションを確認するには、Azure Stack HCI カタログを参照してください。

クラスターを準備する

前提条件が完了したら、クラスター化された VM を備えた GPU を使用するようにクラスターを準備できます。

クラスターを準備するには、VM への割り当てに使用できる GPU が含まれているリソースプールを作成する必要があります。クラスターはこのプールを使用して、GPU リソースプールに割り当てられている起動または移動された VM の VM 配置を決定します。

Windows Admin Center
PowerShell

Windows Admin Center を使用して、クラスター化された VM を備えた GPU を使用するようにクラスターを準備するには、次の手順に従います。

クラスターを準備し、GPU リソースプールに VM を割り当てるには、次のようにします。

Windows Admin Center を起動し、 GPU 拡張機能が既にインストールされていることを確認します。
上部のドロップダウンメニューから [クラスターマネージャー] を選択し、クラスターに接続します。
[設定] メニューで [拡張機能]>[GPU] を選択します。
[ツール] メニューの [拡張機能] で、[GPU] を選択してツールを開きます。
ツールのメインページで、[GPU プール] タブを選択し、[GPU プールの作成] を選択します。
[新しい GPU プール] ページで、次の項目を指定し、[保存] を選択します。
1. サーバー名
2. GPU プール名
3. プールに追加する GPU
プロセスが完了すると、新しい GPU プールの名前とホストサーバーを示す成功プロンプトが表示されます。

PowerShell を使用してクラスター化された VM を備えた GPU を使用するようにクラスターを準備するには、次の手順に従います。

クラスター化された GPU リソースを含む新しい空のリソースプールを各サーバーに作成します。各サーバーで同じプール名を指定するようにしてください。

PowerShell で、管理者として次のコマンドレットを実行します。
```
 New-VMResourcePool -ResourcePoolType PciExpress -Name "GpuChildPool"
```
前の手順で作成したリソースプールに、各サーバーからマウント解除された GPU を追加します。

PowerShell で次のコマンドを実行します。
```
 $gpu = Get-VMHostAssignableDevice

 Add-VMHostAssignableDevice -HostAssignableDevice $gpu -ResourcePoolName "GpuChildPool"
```

これで、割り当て可能な GPU が指定された、クラスター全体のリソースプール (GpuChildPool という名前) が作成されました。クラスターはこのプールを使用して、GPU リソースプールに割り当てられている起動または移動された VM の VM 配置を決定します。

GPU リソースプールへの VM の割り当て

これで、VM を GPU リソースプールに割り当てることができます。クラスター化された GPU リソースプールに 1 つ以上の VM を割り当てたり、クラスター化された GPU リソースプールから VM を削除したりできます。

Windows Admin Center
PowerShell

Windows Admin Center を使用して既存の VM を GPU リソースプールに割り当てるには、次の手順に従います。

Note

また、VM 内のアプリで、それらに割り当てられている GPU を利用できるように、VM 内に GPU 製造元からのドライバーをインストールする必要もあります。

[GPU プールへの仮想マシンの割り当て] ページで、次を指定してから [割り当て] を選択します。
1. サーバー名
2. GPU プール名
3. GPU プールから GPU を割り当てる仮想マシン。
また、メモリマップ I/O (MMIO) 空間の詳細設定値を定義して、単一の GPU のリソース要件を決定することもできます。

プロセスが完了すると、GPU リソースプールの GPU が VM に正常に割り当てられたことを示す確認プロンプトが表示され、VM は [割り当て済み VM] の下に表示されます。

GPU リソースプールから VM の割り当てを解除するには、次のようにします。

[GPU プール] タブで、割り当てを解除する GPU を選択し、[VM の割り当て解除] を選択します。
[GPU プールからの VM の割り当て解除] ページの [仮想マシン] リストボックスで、VM の名前を指定し、[割り当て解除] を選択します。

プロセスが完了すると、VM が GPU プールから割り当て解除されたことを示す成功プロンプトが表示され、[割り当てステータス] の下で GPU に [使用可能 (割り当てられていません)] と表示されます。

PowerShell を使用して既存の VM を GPU リソースプールに割り当てるには、次の手順に従います。

save ではなく、force-shutdown として、クラスター VM リソースの既定のオフラインアクションを構成します。 <vmname> を、GPU リソースプールに割り当てる VM の名前に置き換えます。

PowerShell で次のコマンドレットを実行します。
```
 Get-ClusterResource -name <vmname> | Set-ClusterParameter -Name "OfflineAction" -Value 3
```
以前に作成したリソースプールを VM に割り当てます。リソースプールを割り当てると、VM の起動時または移動時に GpuChildPool プールから割り当てられたデバイスが必要であることがクラスターに宣言されます。

PowerShell で次のコマンドレットを実行します。
```
 Get-ClusterResource -name <vmname> | Add-VMAssignableDevice -ResourcePoolName "GpuChildPool"
```
Note

複数の GPU を VM に追加する場合は、まず、リソースプールに複数の割り当て可能な GPU があることを確認してから、前のコマンドをもう一度実行します。

割り当てられている GPU を VM から削除することもできます。これを行うには、PowerShell で次のコマンドを実行します。 <vmname> を、GPU リソースプールに割り当てる VM の名前に置き換えます。
```
 Add-VMAssignableDevice -VMName $vm -ResourcePoolName "GpuChildPool"

 $vm | Remove-VMAssignableDevice
```

VM を起動すると、クラスターは、このクラスター全体のプールから利用可能な GPU リソースを持つサーバーに VM が配置されるようにします。さらにクラスターによって、DDA を介して GPU が VM に割り当てられます。これにより、VM 内のワークロードから GPU にアクセスできるようになります。

割り当てられた GPU による VM のフェールオーバー

GPU ワークロードを使用可能な状態に維持するクラスターの機能をテストするには、VM が割り当てられた GPU で実行されているサーバーで、ドレイン操作を実行します。サーバーをドレインするには、「フェールオーバークラスターのメンテナンス手順」の手順に従います。作成したプール内の別のサーバーに使用可能な GPU リソースが十分ある限り、クラスターはクラスター内の別のサーバー上で VM を再起動します。

クラスター化された VM を備えた GPU の使用の詳細については、次を参照してください。

VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。

次の方法で共有

クラスター化された VM で GPU を使用する

前提条件

クラスターを準備する

GPU リソースプールへの VM の割り当て

割り当てられた GPU による VM のフェールオーバー

フィードバック

その他のリソース

次の方法で共有

クラスター化された VM で GPU を使用する

前提条件

クラスターを準備する

GPU リソース プールへの VM の割り当て

割り当てられた GPU による VM のフェールオーバー

関連するコンテンツ

フィードバック

その他のリソース

GPU リソースプールへの VM の割り当て