GPU パーティション分割

[アーティクル]
01/10/2025
適用対象:

✅ Windows Server 2025

GPU パーティション分割を使用すると、物理 GPU デバイスを複数の仮想マシン (VM) と共有することができます。 GPU パーティション分割または GPU 仮想化を使用すると、各 VM は GPU 全体ではなく GPU の専用の一部分を取得します。

GPU パーティション分割機能では、シングルルート IO 仮想化 (SR-IOV) インターフェイスを使用します。これにより、ハードウェアに基づくセキュリティ境界が提供され、各 VM のパフォーマンスが予測可能になります。各 VM は、専用の GPU リソースにのみアクセスすることができ、セキュリティで保護されたハードウェアパーティション分割により、他の VM による不正アクセスが防止されます。

Windows Server には、GPU パーティション分割によるライブマイグレーションが導入されています。 GPU パーティション分割ライブマイグレーションを使用するには、一定の要件があります。推奨されるライブマイグレーションのベストプラクティスとは別に、クラスターホストには入出力メモリ管理ユニット (IOMMU) DMA ビットトラッキング対応プロセッサが必要です。たとえば、Intel VT-D または AMD-Vi をサポートするプロセッサなどです。 IOMMU 対応プロセッサなしで Windows Server とライブマイグレーションを使用する場合、GPU リソースが利用可能な場所で VM が自動的に再起動されます。

GPU パーティショニングはスタンドアロンサーバー用に設計されています。計画的なダウンタイムのために、スタンドアロンノード間で VM をライブマイグレーションできます。ただし、計画外のダウンタイムのためにクラスタリングを必要とするお客様は、Windows Server 2025 Datacenter を使用する必要があります。

GPU パーティション分割を使用するタイミング

仮想デスクトップインフラストラクチャ (VDI)、人工知能 (AI)、機械学習 (ML) 推論などの一部のワークロードには GPU アクセラレーションが必要ですが、GPU パーティション分割は、インフラストラクチャ全体の総所有コストを削減するのに役立ちます。

次に例を示します。

VDI アプリケーション: 分散エッジをご利用のお客様は、GPU アクセラレーションを必要とする VDI 環境で、Microsoft Office やグラフィックス負荷の高い視覚化ワークロードなどの基本的な生産性アプリを実行します。このようなワークロードでは、DDA または GPU パーティション分割を使用して必要な GPU アクセラレーションを実現することができます。 GPU パーティション分割を使用すると、複数のパーティションを作成し、VDI 環境をホストしている VM に各パーティションを割り当てることができます。 GPU パーティション分割は、必要な密度を達成し、サポートされるユーザーの数を桁違いに増やすのに役立ちます。
ML を使用した推論: 小売店や製造工場のお客様は、エッジで推論を実行できます。これには、サーバーでの GPU サポートが必要です。サーバー上で GPU を使用すると、ML モデルを実行して、データがクラウドに送信される前に処理できる結果を迅速に得ることができます。必要に応じて、ML モデルを再調整して改善し続けるために、データセット全体を転送することができます。物理 GPU 全体を VM に割り当てる DDA に加えて、GPU パーティション分割を使用すると、複数の推論アプリケーションを同じ GPU 上で並列に実行し、別々の物理パーティションで実行できるため、GPU を最大限に活用することができます。

サポートされているゲストオペレーティングシステム

Windows Server 2025 以降の GPU パーティショニングでは、次のゲストオペレーティングシステムをサポートしています。

Windows 10 またはそれ以降
Windows 10 Enterprise マルチセッション以降
Windows Server 2019 またはそれ以降
Linux Ubuntu 18.04 LTS、Linux Ubuntu 20.04 LTS、Linux Ubuntu 22.04 LTS

サポートされている GPU

次の GPU では、GPU パーティション分割がサポートしています。

NVIDIA A2
NVIDIA A10
NVIDIA A16
NVIDIA A40
NVIDIA L2
NVIDIA L4
NVIDIA L40
NVIDIA L40S

Note

NVIDIA ドライバーでは現在、ライブマイグレーション用の GPU パーティショニングをサポートしていません。

OEM (相手先ブランド供給) パートナーおよび GPU 独立系ハードウェアベンダー (IHV) と協力し、適切な構成と必要なソフトウェアを使用した目的のワークロードのシステムを計画、発注、セットアップすることをお勧めします。ただし、個別のデバイスの割り当て (DDA) を介して GPU アクセラレーションを使用する場合、追加の GPU がサポートされます。 OEM パートナーと IHV に問い合わせて、DDA をサポートする GPU の一覧を取得します。 DDA を介した GPU アクセラレーションの使用について詳しくは、「個別のデバイス割り当て (DDA)」をご覧ください。

パフォーマンスを最大限に高めるには、クラスター内のすべてのサーバーで GPU の同種の構成を作成することをお勧めします。同種の構成を作成するには、製造元とモデルが同じ GPU をインストールして、クラスター内のすべてのサーバーの GPU で同じパーティション数を構成する必要があります。たとえば、1 つ以上の GPU がインストールされている 2 台のサーバーのクラスターでは、すべての GPU の製造元、モデル、サイズが同じでなければなりません。各 GPU のパーティション数も一致している必要があります。

制限事項

GPU パーティション分割機能を使用する場合は、次の制限事項を考慮してください。

構成が同種でない場合、GPU パーティション分割はサポートされません。サポートされない構成の例を次に示します。
- 同じクラスター内に異なるベンダーの GPU が混在している。
- 同じクラスター内で、同じベンダーによる異なる製品ファミリの異なる GPU モデルを使用している。
個別のデバイスの割り当て (DDA) またはパーティション分割可能 GPU の両方として物理 GPU を割り当てることはできません。 DDA またはパーティション分割可能 GPU のいずれかとして割り当てることはできますが、両方を割り当てることはできません。
VM に割り当てることができる GPU パーティションは 1 つだけです。
パーティションは VM に自動的に割り当てられます。特定の VM の特定のパーティションを選択することはできません。
GPU は、Windows Admin Center または PowerShell を使用してパーティション分割することができます。 Windows Admin Center を使用し、GPU パーティションを構成して割り当てることをお勧めします。 Windows Admin Center では、クラスター内のすべてのサーバーで GPU の同種の構成が自動的に検証されます。必要な修正アクションを実行するため、適切な警告とエラーが表示されます。
PowerShell を使用して GPU パーティション分割をプロビジョニングする場合、クラスター内の各サーバーでプロビジョニング手順を実行する必要があります。クラスター内のすべてのサーバーで GPU に対して同種の構成が維持されるよう手動で確認する必要があります。
GPU パーティションが割り当てられた仮想マシンをライブマイグレーションする場合、Hyper-V ライブマイグレーションは自動的に圧縮を伴う TCP/IP の使用に戻ります。仮想マシンを移行すると、ホストの CPU 使用率が増加する可能性があります。加えて、ライブマイグレーションには、GPU パーティションがアタッチされていない仮想マシンより時間がかかる場合があります。

VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。

次の方法で共有

GPU パーティション分割

GPU パーティション分割を使用するタイミング

サポートされているゲストオペレーティングシステム

サポートされている GPU

制限事項

フィードバック

その他のリソース

次の方法で共有

GPU パーティション分割

GPU パーティション分割を使用するタイミング

サポートされているゲスト オペレーティング システム

サポートされている GPU

制限事項

関連するコンテンツ

フィードバック

その他のリソース

サポートされているゲストオペレーティングシステム