Verwenden von GPUs mit gruppierten VMs

Artikel
10/25/2024
Gilt für::

✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Stack HCI, versions 23H2 and 22H2

Gilt für: Azure Stack HCI, Versionen 23H2 und 22H2

Hinweis

Die empfohlene Methode zur Erstellung und Verwaltung von VMs auf Azure Stack HCI 23H2 ist die Verwendung der Azure Arc-Kontrollebene. Verwenden Sie den unten beschriebenen Mechanismus zur Verwaltung Ihrer VMs nur, wenn Sie Funktionen benötigen, die in Azure Arc VMs nicht verfügbar sind.

Sie können GPUs in Ihre Cluster aufnehmen, um GPU-Beschleunigung für Workloads bereitzustellen, die in gruppierten VMs ausgeführt werden. GPU-Beschleunigung kann über GPU-Partitionierung oder diskrete Gerätezuweisung (Discrete Device Assignment, DDA) bereitgestellt werden, die es Ihnen ermöglicht, mindestens eine physische GPU für eine VM zu verwenden. Gruppierte VMs können GPU-Beschleunigung und Clusteringfunktionen wie Hochverfügbarkeit über Failover nutzen. Die Livemigration von virtuellen Computern (VMs) wird derzeit nicht unterstützt, aber VMs können bei einem Fehler automatisch neu gestartet und dort platziert werden, wo GPU-Ressourcen verfügbar sind.

In diesem Artikel erfahren Sie, wie Sie GPUs (Graphics Processing Units) mit gruppierten VMs verwenden, um mithilfe der diskreten Gerätezuweisung GPU-Beschleunigung für Workloads bereitzustellen. Dieser Artikel führt Sie durch die Vorbereitung des Clusters, das Zuweisen einer GPU zu einer Cluster-VM und das Failover dieser VM mithilfe des Windows Admin Center und von PowerShell.

Voraussetzungen

Bevor Sie GPUs mit gruppierten VMs nutzen können, müssen Sie einige Voraussetzungen und Dinge beachten:

Sie benötigen einen Azure Stack HCI-Cluster unter Azure Stack HCI, Version 22H2 oder höher.

Sie benötigen einen Windows Server-Failovercluster unter Windows Server 2025 oder höher.

Sie müssen für alle Server in Ihrem Cluster GPUs derselben Make und dasselbe Modell installieren.
Überprüfen und befolgen Sie die Anweisungen Ihres GPU-Herstellers, um die erforderlichen Treiber und Softwarekomponenten auf jedem Server im Cluster zu installieren.
Abhängig von Ihrem Hardwareanbieter müssen Sie möglicherweise auch GPU-Lizenzierungsanforderungen konfigurieren.
Sie benötigen einen Computer mit installiertem Windows Admin Center. Dieser Computer kann einer Ihrer Clusterknoten sein.

Erstellen Sie einen virtuellen Computer, dem die GPU zugewiesen werden soll. Bereiten Sie diese VM für DDA vor, indem Sie Eigenschaften für Cacheverhalten, Beendigungsaktion und im Speicher abgebildete E/A (Memory-Mapped I/O, MMIO) gemäß den Anweisungen unter Bereitstellen von Grafikgeräten mit Discrete Device Assignment festlegen.
Bereiten Sie die GPUs auf jedem Server vor, indem Sie Treiber für die Risikominderung auf jedem Server installieren, die GPUs deaktivieren und ihre Einbindung auf dem Host aufheben. Weitere Informationen zu diesem Prozess finden Sie unter Bereitstellen von Grafikgeräten mit Discrete Device Assignment.

Führen Sie die Schritte aus, die im Plan für die Bereitstellung von Geräten mithilfe der diskreten Gerätezuweisung aufgeführt sind, um GPU-Geräte im Cluster vorzubereiten.
Vergewissern Sie sich, dass Ihrem Gerät genügend MMIO-Speicherplatz innerhalb der VM zugeordnet ist. Weitere Informationen finden Sie unter MMIO-Bereich.
Erstellen Sie einen virtuellen Computer, dem die GPU zugewiesen werden soll. Bereiten Sie diese VM für DDA vor, indem Sie Eigenschaften für Cacheverhalten, Beendigungsaktion und im Speicher abgebildete E/A (Memory-Mapped I/O, MMIO) gemäß den Anweisungen unter Bereitstellen von Grafikgeräten mit Discrete Device Assignment festlegen.
Bereiten Sie die GPUs auf jedem Server vor, indem Sie Treiber für die Risikominderung auf jedem Server installieren, die GPUs deaktivieren und ihre Einbindung auf dem Host aufheben. Weitere Informationen zu diesem Prozess finden Sie unter Bereitstellen von Grafikgeräten mit Discrete Device Assignment.

Hinweis

Ihr System muss von der Azure Stack HCI-Lösung mit GPU-Unterstützung unterstützt werden. Stöbern Sie im Azure Stack HCI-Katalog nach Optionen.

Vorbereiten des Clusters

Wenn die Voraussetzungen erfüllt sind, können Sie den Cluster für die Verwendung von GPUs mit gruppierten VMs vorbereiten.

Beim Vorbereiten des Clusters wird u. a. ein Ressourcenpool mit den GPUs erstellt, die für die Zuweisung zu VMs verfügbar sind. Der Cluster verwendet diesen Pool, um die VM-Platzierung für alle gestarteten oder verschobenen VMs zu bestimmen, die dem GPU-Ressourcenpool zugewiesen sind.

Windows Admin Center
PowerShell

Führen Sie mithilfe von Windows Admin Center die folgenden Schritte aus, um den Cluster für die Verwendung von GPUs mit gruppierten VMs vorzubereiten.

So bereiten Sie den Cluster vor und weisen einen virtuellen Computer einem GPU-Ressourcenpool zu:

Starten Sie das Windows Admin Center und stellen Sie sicher, dass die Erweiterung GPUs bereits installiert ist.
Wählen Sie Cluster Manager aus dem oberen Dropdown-Menü und verbinden Sie sich mit Ihrem Cluster.
Wählen Sie im Menü Einstellungen Erweiterungen>GPUs.
Wählen Sie im Menü Extras unter Erweiterungendie Option GPUs aus, um das Tool zu öffnen.
Wählen Sie auf der Hauptseite des Tools die Registerkarte GPU-Pools und dann GPU-Pool erstellen aus.
Geben Sie auf der Seite Neuer GPU-Pool Folgendes an, und wählen Sie dann Speichern aus:
1. Servername
2. Name des GPU-Pools
3. GPUs, die Sie dem Pool hinzufügen möchten
Nach Abschluss des Vorgangs erhalten Sie eine Erfolgsmeldung, die den Namen des neuen GPU-Pools und des Hostservers anzeigt.

Führen Sie die folgenden Schritte aus, um den Cluster für die Verwendung von GPUs mit gruppierten VMs mithilfe von PowerShell vorzubereiten.

Erstellen Sie auf jedem Server, der die gruppierten GPU-Ressourcen enthält, einen neuen leeren Ressourcenpool. Stellen Sie sicher, dass Sie auf jedem Server den gleichen Poolnamen angeben.

Führen Sie das folgende Cmdlet als Administrator in PowerShell aus:
```
 New-VMResourcePool -ResourcePoolType PciExpress -Name "GpuChildPool"
```
Fügen Sie die GPUs mit aufgehobener Bereitstellung von jedem Server dem Ressourcenpool hinzu, den Sie im vorherigen Schritt erstellt haben.

Führen Sie in PowerShell die folgenden Befehle aus:
```
 $gpu = Get-VMHostAssignableDevice

 Add-VMHostAssignableDevice -HostAssignableDevice $gpu -ResourcePoolName "GpuChildPool"
```

Sie verfügen nun über einen clusterweiten Ressourcenpool (mit dem Namen GpuChildPool), der mit zuweisbaren GPUs aufgefüllt wird. Der Cluster verwendet diesen Pool, um die VM-Platzierung für alle gestarteten oder verschobenen VMs zu bestimmen, die dem GPU-Ressourcenpool zugewiesen sind.

Zuweisen einer VM zu einem GPU-Ressourcenpool

Sie können jetzt einem GPU-Ressourcenpool eine VM zuweisen. Sie können einem gruppierten GPU-Ressourcenpool einen oder mehrere virtuelle Computer zuweisen und einen virtuellen Computer aus einem gruppierten GPU-Ressourcenpool entfernen.

Windows Admin Center
PowerShell

Führen Sie die folgenden Schritte aus, um einem GPU-Ressourcenpool mithilfe von Windows Admin Center einen vorhandenen virtuellen Computer zuzuweisen.

Hinweis

Sie müssen auch Treiber ihres GPU-Herstellers auf der VM installieren, damit Apps auf der VM die ihnen zugewiesene GPU nutzen können.

Geben Sie auf der Seite VM zu GPU-Pool zuweisen Folgendes an, und wählen Sie dann Zuweisen aus:
1. Servername
2. Name des GPU-Pools
3. Virtueller Computer, dem Sie die GPU aus dem GPU-Pool zuweisen möchten.
Sie können auch erweiterte Einstellungswerte für MMIO-Bereiche (Memory-Mapped IO) definieren, um die Ressourcenanforderungen für eine einzelne GPU zu bestimmen.

Nach Abschluss des Vorgangs erhalten Sie eine Bestätigungsaufforderung, die anzeigt, dass Sie die GPU aus dem GPU-Ressourcenpool erfolgreich der VM zugewiesen haben, die unter Zugewiesene VMs angezeigt wird.

So heben Sie die Zuweisung einer VM zu einem GPU-Ressourcenpool auf:

Wählen Sie auf der Registerkarte GPU-Pools die GPU aus, deren Zuweisung Sie aufheben möchten, und wählen Sie dann Zuweisung der VM aufheben aus.
Geben Sie auf der Seite Zuweisung der VM zu GPU-Pool aufheben im Listenfeld Virtuelle Computer den Namen der VM an, und wählen Sie dann Zuweisung aufheben aus.

Nach Abschluss des Vorgangs erhalten Sie eine Erfolgsmeldung, dass die Zuweisung der VM aus dem GPU-Pool aufgehoben wurde, und unter Zuweisungsstatus wird für die GPU Verfügbar (Nicht zugewiesen) angezeigt.

Führen Sie die folgenden Schritte aus, um einem GPU-Ressourcenpool mithilfe von PowerShell einen vorhandenen virtuellen Computer zuzuweisen.

Konfigurieren Sie die standardmäßige Offlineaktion der Cluster-VM-Ressource als force-shutdown und nicht als save. Ersetzen Sie dabei <vmname> durch den Namen der VM, die Sie dem GPU-Ressourcenpool zuweisen möchten.

Führen Sie in PowerShell das folgende Cmdlet aus:
```
 Get-ClusterResource -name <vmname> | Set-ClusterParameter -Name "OfflineAction" -Value 3
```
Weisen Sie den Ressourcenpool, den Sie zuvor erstellt haben, der VM zu. Durch das Zuweisen des Ressourcenpools wird für den Cluster deklariert, dass die VM ein zugewiesenes Gerät aus dem Pool GpuChildPool benötigt, wenn sie gestartet oder verschoben wird.

Führen Sie in PowerShell das folgende Cmdlet aus:
```
 Get-ClusterResource -name <vmname> | Add-VMAssignableDevice -ResourcePoolName "GpuChildPool"
```
Hinweis

Wenn Sie der VM mehr als eine GPU hinzufügen möchten, überprüfen Sie zunächst, ob im Ressourcenpool mehr als eine zuweisbare GPU verfügbar ist, und führen Sie dann den vorherigen Befehl erneut aus.

Sie können auch eine zugewiesene GPU von einem virtuellen Computer entfernen. Führen Sie hierzu in PowerShell den folgenden Befehl aus. Ersetzen Sie dabei <vmname> durch den Namen der VM, die Sie dem GPU-Ressourcenpool zuweisen möchten.
```
 Add-VMAssignableDevice -VMName $vm -ResourcePoolName "GpuChildPool"

 $vm | Remove-VMAssignableDevice
```

Wenn Sie die VM starten, stellt der Cluster sicher, dass die VM auf einem Server mit verfügbaren GPU-Ressourcen aus diesem clusterweiten Pool platziert wird. Der Cluster weist der VM auch die GPU über DDA zu, wodurch von Workloads innerhalb der VM auf die GPU zugegriffen werden kann.

Ausführen eines Failovers für eine VM mit einer zugewiesenen GPU

Um zu testen, ob der Cluster Ihre GPU-Workload verfügbar halten kann, führen Sie einen Ausgleichsvorgang auf dem Server aus, auf dem die VM mit einer zugewiesenen GPU ausgeführt wird. Befolgen Sie die Anweisungen unter Wartungsverfahren für Failovercluster, um den Server zu entladen. Der Cluster startet die VM auf einem anderen Server im Cluster neu, sofern ein anderer Server über ausreichend verfügbare GPU-Ressourcen in dem von Ihnen erstellten Pool verfügt.

Weitere Informationen zur Verwendung von GPUs mit Ihren gruppierten VMs finden Sie unter:

Weitere Informationen zur Verwendung von GPUs mit Ihren VMs und zur GPU-Partitionierung finden Sie unter:

Freigeben über

Verwenden von GPUs mit gruppierten VMs

Voraussetzungen

Vorbereiten des Clusters

Zuweisen einer VM zu einem GPU-Ressourcenpool

Ausführen eines Failovers für eine VM mit einer zugewiesenen GPU

Feedback

Zusätzliche Ressourcen

Freigeben über

Verwenden von GPUs mit gruppierten VMs

Voraussetzungen

Vorbereiten des Clusters

Zuweisen einer VM zu einem GPU-Ressourcenpool

Ausführen eines Failovers für eine VM mit einer zugewiesenen GPU

Zugehöriger Inhalt

Feedback

Zusätzliche Ressourcen