GPU-partitionering
Med GPU-partitionering kan du dela en fysisk GPU-enhet med flera virtuella datorer . Med GPU-partitionering eller GPU-virtualisering får varje virtuell dator en dedikerad del av GPU:n i stället för hela GPU:n.
GPU-partitioneringsfunktionen använder gränssnittet single root IO Virtualization (SR-IOV), som ger en maskinvarubaserad säkerhetsgräns med förutsägbara prestanda för varje virtuell dator. Varje virtuell dator kan endast komma åt de GPU-resurser som är dedikerade till dem och den säkra maskinvarupartitioneringen förhindrar obehörig åtkomst från andra virtuella datorer.
Windows Server introducerar direktmigrering med GPU-partitionering. Det finns specifika krav för att använda direktmigrering av GPU-partitionering. Förutom rekommenderade metodtips för direktmigrering måste dina klustervärdar ha DMA-bitspårningskompatibla processorer (Input/Output Memory Management Unit) (IOMMU). Till exempel processorer som stöder Intel VT-D eller AMD-Vi. Om du använder Windows Server och direktmigrering utan IOMMU-aktiverade processorer startas de virtuella datorerna automatiskt om där GPU-resurser är tillgängliga.
GPU-partitionering är utformat för fristående servrar. Du kan direktmigrera virtuella datorer mellan fristående noder för planerad stilleståndstid. Men för kunder som kräver klustring för oplanerad stilleståndstid måste du använda Windows Server 2025 Datacenter.
När GPU-partitionering ska användas
Vissa arbetsbelastningar, till exempel VDI (Virtual Desktop Infrastructure), Artificial Intelligent (AI) och Machine Learning (ML) inferens kräver GPU-acceleration, GPU-partitionering kan bidra till att minska den totala ägandekostnaden för din övergripande infrastruktur.
Till exempel:
VDI-program: Distribuerade edge-kunder kör grundläggande produktivitetsappar, till exempel Microsoft Office och grafikintensiva visualiseringsarbetsbelastningar i sina VDI-miljöer, vilket kräver GPU-acceleration. För sådana arbetsbelastningar kan du uppnå den GPU-acceleration som krävs via DDA- eller GPU-partitionering. Med GPU-partitionering kan du skapa flera partitioner och tilldela varje partition till en virtuell dator som är värd för en VDI-miljö. GPU-partitionering hjälper dig att uppnå önskad densitet och skala antalet användare som stöds efter storleksordning.
Slutsatsdragning med ML: Kunder i butiker och tillverkningsanläggningar kan köra slutsatsdragning vid gränsen, vilket kräver GPU-stöd för sina servrar. Med GPU på dina servrar kan du köra ML-modeller för att få snabba resultat som kan utföras innan data skickas till molnet. Du kan också överföra den fullständiga datauppsättningen för att fortsätta träna om och förbättra DINA ML-modeller. Tillsammans med DDA där du tilldelar en hel fysisk GPU till en virtuell dator, gör GPU-partitionering att du kan köra flera slutsatsdragningsprogram parallellt på samma GPU, men i separata fysiska partitioner, vilket använder GPU till maximalt.
Gästoperativsystem som stöds
GPU-partitionering på Windows Server 2025 och senare stöder följande gästoperativsystem:
- Windows 10 eller senare
- Windows 10 Enterprise flera sessioner eller senare
- Windows Server 2019 eller senare
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
GPU:er som stöds
Följande GPU:er stöder GPU-partitionering:
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Not
NVIDIA-drivrutinen stöder för närvarande inte GPU-partitionering för direktmigrering.
Vi rekommenderar att du arbetar med dina OEM-partner (Original Equipment Manufacturer) och GPU Independent Hardware Vendors (IHV) för att planera, beställa och konfigurera systemen för dina önskade arbetsbelastningar med lämpliga konfigurationer och nödvändig programvara. Vi stöder dock fler GPU:er om du vill använda GPU-acceleration via diskret enhetstilldelning (DDA). Kontakta dina OEM-partner och IHV:er för att få en lista över GPU:er som stöder DDA. Mer information om hur du använder GPU-acceleration via DDA finns i Diskret enhetstilldelning (DDA).
För bästa prestanda rekommenderar vi att du skapar en homogen konfiguration för GPU:er på alla servrar i klustret. En homogen konfiguration består av att installera samma märke och modell för GPU:n och konfigurera samma partitionsantal i GPU:erna på alla servrar i klustret. I ett kluster med två servrar med en eller flera GPU:er installerade måste alla GPU:er ha samma märke, modell och storlek. Partitionsantalet för varje GPU måste också matcha.
Begränsningar
Tänk på följande begränsningar när du använder GPU-partitioneringsfunktionen:
GPU-partitionering stöds inte om konfigurationen inte är homogen. Här följer några exempel på konfigurationer som inte stöds:
Blanda GPU:er från olika leverantörer i samma kluster.
Använda olika GPU-modeller från olika produktfamiljer från samma leverantör i samma kluster.
Du kan inte tilldela en fysisk GPU som både Diskret enhetstilldelning (DDA) och partitionsbar GPU. Du kan antingen tilldela den som DDA eller som partitionsbar GPU, men inte båda.
Du kan bara tilldela en enda GPU-partition till en virtuell dator.
Partitioner tilldelas automatiskt till de virtuella datorerna. Du kan inte välja en specifik partition för en specifik virtuell dator.
Du kan partitionera din GPU med hjälp av Windows Administrationscenter eller med hjälp av PowerShell. Vi rekommenderar att du använder Windows Admin Center för att konfigurera och tilldela GPU-partitioner. Windows Admin Center validerar automatiskt för en homogen konfiguration av GPU:er för alla servrar i klustret. Den innehåller lämpliga varningar och fel för att vidta eventuella korrigerande åtgärder som behövs.
Om du använder PowerShell för att etablera GPU-partitionering måste du utföra etableringsstegen på varje server i klustret. Du måste manuellt se till att den homogena konfigurationen underhålls för GPU:er på alla servrar i klustret.
Vid direktmigrering av en virtuell dator med en tilldelad GPU-partition återgår Hyper-V direktmigrering automatiskt till att använda TCP/IP med komprimering. Att migrera en virtuell dator har den potentiella effekten att öka processoranvändningen för en värd. Dessutom kan direktmigreringar ta längre tid än med virtuella datorer utan att GPU-partitioner är anslutna.
Relaterat innehåll
Mer information om hur du använder GPU:er med dina virtuella datorer och GPU-partitionering finns i: