Dělení GPU
Dělení GPU umožňuje sdílet fyzické zařízení GPU s několika virtuálními počítači. Při dělení GPU nebo virtualizaci GPU získá každý virtuální počítač vyhrazený zlomek GPU místo celého GPU.
Funkce dělení GPU používá rozhraní Single Root IO Virtualization (SR-IOV), které poskytuje bezpečnostní hranici zajištěnou hardwarově s předvídatelným výkonem pro každý virtuální počítač. Každý virtuální počítač má přístup pouze k prostředkům GPU vyhrazeným pro ně a zabezpečené hardwarové dělení brání neoprávněnému přístupu jiných virtuálních počítačů.
Windows Server zavádí migraci za provozu s dělením GPU. Existují specifické požadavky na použití migrace oddílů GPU za provozu. Kromě doporučených osvědčených postupů migrace za provozu musí hostitelé clusteru mít procesory podporující sledování bitů DMA (Input/Output Memory Management Unit). Například procesory podporující intel VT-D nebo AMD-Vi. Pokud používáte Windows Server a migraci za provozu bez procesorů s podporou ioMMU, virtuální počítače se automaticky restartují tam, kde jsou k dispozici prostředky GPU.
Dělení GPU je navržené pro samostatné servery. Virtuální počítače můžete migrovat za provozu mezi samostatnými uzly pro plánované výpadky, avšak pro zákazníky, kteří vyžadují clustering pro neplánované výpadky, musíte použít Windows Server 2025 Datacenter.
Kdy použít dělení GPU
Některé úlohy, jako je infrastruktura virtuálních klientských počítačů (VDI), umělá inteligence (AI) a odvozování strojového učení (ML), vyžadují akceleraci GPU, dělení GPU může pomoct snížit celkové náklady na vlastnictví vaší celkové infrastruktury.
Například:
Aplikace VDI: Zákazníci distribuovaných edge systémů spouštějí základní kancelářské aplikace, jako je Microsoft Office a úlohy vizualizace náročné na grafiku, ve svých prostředích VDI, které vyžadují akceleraci GPU. U takových úloh můžete dosáhnout požadovaného zrychlení GPU prostřednictvím DDA nebo partitionování GPU. Pomocí dělení GPU můžete vytvořit několik oddílů a přiřadit každý oddíl virtuálnímu počítači, který je hostitelem prostředí VDI. Dělení GPU vám pomůže dosáhnout požadované hustoty a řádově zvětšit počet podporovaných uživatelů.
Inference s ML: Zákazníci v maloobchodních prodejnách a výrobních závodech můžou provádět inference na edge zařízeních, což vyžaduje podporu GPU pro jejich servery. Pomocí GPU na vašich serverech můžete spouštět modely ML, abyste získali rychlé výsledky, které je možné zpracovat před odesláním dat do cloudu. Úplnou sadu dat je možné volitelně přenést, abyste mohli pokračovat v přetrénování a vylepšování modelů ML. Spolu s DDA, kde přiřadíte virtuálnímu počítači celé fyzické GPU, vám dělení GPU umožňuje paralelně spouštět více aplikací odvozování na stejném GPU, ale v samostatných fyzických oddílech, čímž se gpu využívá k maximálnímu využití GPU.
Podporované hostující operační systémy
Dělení GPU ve Windows Serveru 2025 a novějším podporuje tyto hostující operační systémy:
- Windows 10 nebo novější
- Windows 10 Enterprise s více relacemi nebo novější
- Windows Server 2019 nebo novější
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
Podporované gpu
Následující gpu podporují dělení GPU:
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Poznámka
Ovladač NVIDIA v současné době nepodporuje dělení GPU pro migraci za provozu.
Doporučujeme spolupracovat s partnery výrobce OEM (Original Equipment Manufacturer) a nezávislými výrobci hardwaru GPU (IHV) k plánování, objednávání a nastavení systémů pro požadované úlohy s odpovídajícími konfiguracemi a nezbytným softwarem. Pokud ale chcete použít akceleraci GPU prostřednictvím diskrétního přiřazení zařízení (DDA), podporujeme více GPU. Spojte se s partnery OEM a nezávislými dodavateli hardwaru (IHV), abyste získali seznam GPU, které podporují DDA. Další informace o použití akcelerace GPU prostřednictvím DDA naleznete v tématu Diskrétní přiřazení zařízení (DDA).
Pro zajištění nejlepšího výkonu doporučujeme vytvořit homogenní konfiguraci gpu na všech serverech v clusteru. Homogenní konfigurace se skládá z instalace stejného modelu a modelu GPU a konfigurace stejného počtu oddílů v GPU na všech serverech v clusteru. Například v clusteru dvou serverů s nainstalovaným jedním nebo více grafickými procesory musí mít všechny gpu stejné provedení, model a velikost. Počet oddílů na každém GPU se musí shodovat.
Omezení
Při používání funkce dělení GPU zvažte následující omezení:
Dělení GPU není podporováno, pokud vaše konfigurace není homogenní. Tady je několik příkladů nepodporovaných konfigurací:
Kombinování grafických procesorů od různých dodavatelů ve stejném clusteru
Použití různých modelů GPU z různých řad produktů od stejného dodavatele ve stejném clusteru
Nemůžete přiřadit fyzické GPU jako Discrete Device Assignment (DDA) ani jako dělitelné GPU. Můžete ho buď přiřadit jako DDA, nebo jako dělitelné GPU, ale ne obojí.
Virtuálnímu počítači můžete přiřadit jenom jeden oddíl GPU.
Oddíly se automaticky přiřazují k virtuálním počítačům. Nemůžete zvolit konkrétní oddíl pro konkrétní virtuální počítač.
Gpu můžete rozdělit na oddíly pomocí Centra pro správu Windows nebo pomocí PowerShellu. Ke konfiguraci a přiřazení oddílů GPU doporučujeme použít Centrum pro správu Windows. Windows Admin Center automaticky ověří homogenní konfiguraci GPU na všech serverech v clusteru. Poskytuje příslušná upozornění a chyby, aby bylo možné přijmout potřebná nápravná opatření.
Pokud ke zřizování oddílů GPU používáte PowerShell, musíte provést kroky zřizování na každém serveru v clusteru. Musíte ručně zajistit, aby se pro GPU na všech serverech v clusteru zachovala homogenní konfigurace.
Když migrujete virtuální počítač za provozu s přiřazeným oddílem GPU, Hyper-V migrace za provozu automaticky přechází na použití protokolu TCP/IP s kompresí dat. Migrace virtuálního počítače má potenciální vliv na zvýšení využití procesoru hostitele. Migrace za provozu navíc můžou trvat déle než u virtuálních počítačů bez připojených oddílů GPU.
Související obsah
Další informace o používání GPU s virtuálními počítači a dělením GPU najdete v tématech: