GPU パーティション分割
適用対象: Azure Local バージョン 23H2 および 22H2
GPU パーティション分割を使用すると、物理 GPU デバイスを複数の仮想マシン (VM) と共有することができます。 GPU パーティション分割または GPU 仮想化を使用すると、各 VM は GPU 全体ではなく GPU の専用の一部分を取得します。
GPU パーティション分割機能では、 シングル ルート IO 仮想化 (SR-IOV) インターフェイスを使用します。これにより、ハードウェアに基づくセキュリティ境界が提供され、各 VM のパフォーマンスが予測可能になります。 各 VM は、専用の GPU リソースにのみアクセスすることができ、セキュリティで保護されたハードウェア パーティション分割により、他の VM による不正アクセスが防止されます。
Windows Server には、GPU パーティション分割によるライブ マイグレーションが導入されています。 GPU パーティション分割ライブ マイグレーションを使用するには、一定の要件があります。 推奨されるライブ マイグレーションのベスト プラクティスとは別に、クラスター ホストには入出力メモリ管理ユニット (IOMMU) DMA ビット トラッキング対応プロセッサが必要です。 たとえば、Intel VT-D または AMD-Vi をサポートするプロセッサなどです。 IOMMU 対応プロセッサなしで Windows Server とライブ マイグレーションを使用する場合、GPU リソースが利用可能な場所で VM が自動的に再起動されます。
GPU パーティショニングはスタンドアロン サーバー用に設計されています。 計画的なダウンタイムのために、スタンドアロン ノード間で VM をライブ マイグレーションできます。ただし、計画外のダウンタイムのためにクラスタリングを必要とするお客様は、Windows Server 2025 Datacenter を使用する必要があります。
GPU パーティション分割を使用するタイミング
仮想デスクトップ インフラストラクチャ (VDI)、人工知能 (AI)、機械学習 (ML) 推論などの一部のワークロードには GPU アクセラレーションが必要ですが、GPU パーティション分割は、インフラストラクチャ全体の総所有コストを削減するのに役立ちます。
次に例を示します。
VDI アプリケーション: 分散エッジをご利用のお客様は、GPU アクセラレーションを必要とする VDI 環境で、Microsoft Office やグラフィックス負荷の高い視覚化ワークロードなどの基本的な生産性アプリを実行します。 このようなワークロードでは、DDA または GPU パーティション分割を使用して必要な GPU アクセラレーションを実現することができます。 GPU パーティション分割を使用すると、複数のパーティションを作成し、VDI 環境をホストしている VM に各パーティションを割り当てることができます。 GPU パーティション分割は、必要な密度を達成し、サポートされるユーザーの数を桁違いに増やすのに役立ちます。
ML を使用した推論: 小売店や製造工場のお客様は、エッジで推論を実行できます。これには、サーバーでの GPU サポートが必要です。 サーバー上で GPU を使用すると、ML モデルを実行して、データがクラウドに送信される前に処理できる結果を迅速に得ることができます。 必要に応じて、ML モデルを再調整して改善し続けるために、データ セット全体を転送することができます。 物理 GPU 全体を VM に割り当てる DDA に加えて、GPU パーティション分割を使用すると、複数の推論アプリケーションを同じ GPU 上で並列に実行し、別々の物理パーティションで実行できるため、GPU を最大限に活用することができます。
サポートされているゲスト オペレーティング システム
Windows Server 2025 以降の GPU パーティショニングでは、次のゲスト オペレーティング システムをサポートしています。
Azure Local での GPU パーティション分割では、次のゲスト オペレーティング システムがサポートされています。
- Windows 10 またはそれ以降
- Windows 10 Enterprise マルチセッション以降
- Windows Server 2019 またはそれ以降
- Linux Ubuntu 18.04 LTS、Linux Ubuntu 20.04 LTS、Linux Ubuntu 22.04 LTS
サポートされている GPU
次の GPU では、GPU パーティション分割がサポートしています。
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Note
NVIDIA ドライバーでは現在、ライブ マイグレーション用の GPU パーティショニングをサポートしていません。
OEM (相手先ブランド供給) パートナーおよび GPU 独立系ハードウェア ベンダー (IHV) と協力し、適切な構成と必要なソフトウェアを使用した目的のワークロードのシステムを計画、発注、セットアップすることをお勧めします。 ただし、個別のデバイスの割り当て (DDA) を介して GPU アクセラレーションを使用する場合、追加の GPU がサポートされます。 OEM パートナーと IHV に問い合わせて、DDA をサポートする GPU の一覧を取得します。 DDA を介した GPU アクセラレーションの使用について詳しくは、「個別のデバイス割り当て (DDA)」をご覧ください。
パフォーマンスを最大限に高めるには、クラスター内のすべてのサーバーで GPU の同種の構成を作成することをお勧めします。 同種の構成を作成するには、製造元とモデルが同じ GPU をインストールして、クラスター内のすべてのサーバーの GPU で同じパーティション数を構成する必要があります。 たとえば、1 つ以上の GPU がインストールされている 2 台のサーバーのクラスターでは、すべての GPU の製造元、モデル、サイズが同じでなければなりません。 各 GPU のパーティション数も一致している必要があります。
制限事項
GPU パーティション分割機能を使用する場合は、次の制限事項を考慮してください。
構成が同種でない場合、GPU パーティション分割はサポートされません。 サポートされない構成の例を次に示します。
同じクラスター内に異なるベンダーの GPU が混在している。
同じクラスター内で、同じベンダーによる異なる製品ファミリの異なる GPU モデルを使用している。
個別のデバイスの割り当て (DDA) またはパーティション分割可能 GPU の両方として物理 GPU を割り当てることはできません。 DDA またはパーティション分割可能 GPU のいずれかとして割り当てることはできますが、両方を割り当てることはできません。
VM に割り当てることができる GPU パーティションは 1 つだけです。
パーティションは VM に自動的に割り当てられます。 特定の VM の特定のパーティションを選択することはできません。
- 現時点では、Azure Local での GPU パーティション分割では、VM のライブ マイグレーションはサポートされていません。 ただし、エラーが発生した場合、VM を自動的に再起動して GPU リソースを使用できる場所に配置できます。
GPU は、Windows Admin Center または PowerShell を使用してパーティション分割することができます。 Windows Admin Center を使用し、GPU パーティションを構成して割り当てることをお勧めします。 Windows Admin Center では、クラスター内のすべてのサーバーで GPU の同種の構成が自動的に検証されます。 必要な修正アクションを実行するため、適切な警告とエラーが表示されます。
PowerShell を使用して GPU パーティション分割をプロビジョニングする場合、クラスター内の各サーバーでプロビジョニング手順を実行する必要があります。 クラスター内のすべてのサーバーで GPU に対して同種の構成が維持されるよう手動で確認する必要があります。
- GPU パーティションが割り当てられた仮想マシンをライブ マイグレーションする場合、Hyper-V ライブ マイグレーションは自動的に圧縮を伴う TCP/IP の使用に戻ります。 仮想マシンを移行すると、ホストの CPU 使用率が増加する可能性があります。 加えて、ライブ マイグレーションには、GPU パーティションがアタッチされていない仮想マシンより時間がかかる場合があります。
関連するコンテンツ
VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。
VM と GPU パーティション分割で GPU を使用する方法について詳しくは、次をご覧ください。