GPU-partitionering
Met GPU-partitionering kunt u een fysiek GPU-apparaat delen met meerdere virtuele machines (VM's). Met GPU-partitionering of GPU-virtualisatie krijgt elke VIRTUELE machine een toegewezen fractie van de GPU in plaats van de volledige GPU.
De GPU-partitioneringsfunctie maakt gebruik van de Single Root IO Virtualization (SR-IOV) interface, die een beveiligingsgrens met hardware-ondersteuning biedt met voorspelbare prestaties voor elke VM. Elke VIRTUELE machine heeft alleen toegang tot de GPU-resources die eraan zijn toegewezen en de beveiligde hardwarepartitionering voorkomt onbevoegde toegang door andere VM's.
Windows Server introduceert livemigratie met GPU-partitionering. Er zijn specifieke vereisten voor het gebruik van livemigratie met GPU-partitionering. Afgezien van de aanbevolen beste werkwijzen voor livemigratie, moeten uw clusterhosts processors hebben die geschikt zijn voor het traceren van DMA-bits (Input/Output Memory Management Unit). Bijvoorbeeld processors die Intel VT-D of AMD-Vi ondersteunen. Als u Windows Server en livemigratie zonder IOMMU-processors gebruikt, worden de VM's automatisch opnieuw opgestart waar GPU-resources beschikbaar zijn.
GPU-partitionering is ontworpen voor zelfstandige servers. U kunt virtuele machines live migreren tussen zelfstandige knooppunten voor geplande downtime; Voor klanten die clustering vereisen voor niet-geplande downtime, moet u Echter Windows Server 2025 Datacenter gebruiken.
Wanneer gpu-partitionering gebruiken
Voor sommige workloads, zoals Virtual Desktop Infrastructure (VDI), artificiële intelligentie (AI) en Machine Learning (ML) die inferentie vereisen, is GPU-versnelling nodig. GPU-partitionering kan helpen de totale eigendomskosten van uw gehele infrastructuur te verminderen.
Bijvoorbeeld:
VDI-toepassingen: gedistribueerde edge-klanten voeren eenvoudige productiviteitsapps uit, zoals Microsoft Office en werkbelastingen met veel afbeeldingen in hun VDI-omgevingen, waarvoor GPU-versnelling is vereist. Voor dergelijke workloads kunt u de vereiste GPU-versnelling bereiken via DDA- of GPU-partitionering. Met GPU-partitionering kunt u meerdere partities maken en elke partitie toewijzen aan vm die als host fungeert voor een VDI-omgeving. MET GPU-partitionering kunt u de gewenste dichtheid bereiken en het aantal ondersteunde gebruikers schalen op volgorde van grootte.
Deductie met ML: Klanten in winkels en productiebedrijven kunnen deductie aan de rand uitvoeren. Hiervoor is GPU-ondersteuning voor hun servers vereist. Met GPU op uw servers kunt u ML-modellen uitvoeren om snelle resultaten te krijgen waarop actie kan worden ondernomen voordat de gegevens naar de cloud worden verzonden. De volledige gegevensset kan eventueel worden overgedragen om uw ML-modellen opnieuw te trainen en te verbeteren. Naast DDA waar u een volledige fysieke GPU toewijst aan een VIRTUELE machine, kunt u met GPU-partitionering meerdere deductietoepassingen parallel uitvoeren op dezelfde GPU, maar in afzonderlijke fysieke partities, waardoor de GPU tot het maximum wordt gebruikt.
Ondersteunde gastbesturingssystemen
GPU-partitionering op Windows Server 2025 en hoger ondersteunt deze gastbesturingssystemen:
- Windows 10 of hoger
- Windows 10 Enterprise voor meerdere sessies of hoger
- Windows Server 2019 of hoger
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
Ondersteunde GPU's
De volgende GPU's ondersteunen GPU-partitionering:
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Notitie
Het NVIDIA-stuurprogramma biedt momenteel geen ondersteuning voor GPU-partitionering voor livemigratie.
U wordt aangeraden samen te werken met uw OEM-partners (Original Equipment Manufacturer) en GPU Independent Hardware Vendor (IHD's) om de systemen voor uw gewenste workloads te plannen, te bestellen en in te stellen met de juiste configuraties en de benodigde software. We ondersteunen echter meer GPU's als u GPU-versnelling wilt gebruiken via discrete apparaattoewijzing (DDA). Neem contact op met uw OEM-partners en IHD's om een lijst met GPU's te krijgen die DDA ondersteunen. Zie Discrete Device Assignment (DDA)voor meer informatie over het gebruik van GPU-versnelling via DDA.
Voor de beste prestaties raden we u aan een homogene configuratie te maken voor GPU's op alle servers in uw cluster. Een homogene configuratie bestaat uit het installeren van hetzelfde merk en model van de GPU en het configureren van hetzelfde aantal partities in de GPU's op alle servers in het cluster. In een cluster met twee servers waarop een of meer GPU's zijn geïnstalleerd, moeten alle GPU's bijvoorbeeld hetzelfde merk, model en grootte hebben. Het aantal partities op elke GPU moet ook overeenkomen.
Beperkingen
Houd rekening met de volgende beperkingen bij het gebruik van de GPU-partitioneringsfunctie:
GPU-partitionering wordt niet ondersteund als uw configuratie niet homogeen is. Hier volgen enkele voorbeelden van niet-ondersteunde configuraties:
GPU's van verschillende leveranciers in hetzelfde cluster combineren.
Het gebruik van verschillende GPU-modellen uit verschillende productfamilies van dezelfde leverancier in hetzelfde cluster.
U kunt geen fysieke GPU toewijzen als zowel discrete apparaattoewijzing (DDA) als partitioneerbare GPU. U kunt deze toewijzen als DDA of als partitionerbare GPU, maar niet beide.
U kunt slechts één GPU-partitie toewijzen aan een VIRTUELE machine.
Partities worden automatisch toegewezen aan de VIRTUELE machines. U kunt geen specifieke partitie voor een specifieke VIRTUELE machine kiezen.
U kunt uw GPU partitioneren via het Windows-beheercentrum of met behulp van PowerShell. U wordt aangeraden Windows Admin Center te gebruiken om GPU-partities te configureren en toe te wijzen. Windows Admin Center valideert automatisch voor een homogene configuratie van de GPU's op alle servers in uw cluster. Het biedt passende waarschuwingen en fouten om corrigerende maatregelen te nemen die nodig zijn.
Als u PowerShell gebruikt om GPU-partitionering in te richten, moet u de inrichtingsstappen uitvoeren op elke server in het cluster. U moet er handmatig voor zorgen dat de homogene configuratie wordt onderhouden voor GPU's op alle servers in uw cluster.
Bij het live migreren van een virtuele machine waaraan een GPU-partitie is toegewezen, zal de Hyper-V livemigratie automatisch terugvallen op het gebruik van TCP/IP met compressie. Het migreren van een virtuele machine heeft het mogelijke effect van het verhogen van het CPU-gebruik van een host. Bovendien kunnen livemigraties langer duren dan met virtuele machines zonder GPU-partities gekoppeld.
Verwante inhoud
Zie voor meer informatie over het gebruik van GPU's met uw VM's en GPU-partitionering: