Creación de particiones de GPU
Se aplica a: Azure Stack HCI, versiones 23H2 y 22H2
La creación de particiones de GPU le permite compartir un dispositivo de GPU físico con varias máquinas virtuales (MV). Con la creación de particiones o la virtualización de GPU, cada máquina virtual obtiene una fracción dedicada del dispositivo GPU en lugar del dispositivo completo.
La característica de creación de particiones de GPU usa la interfaz de virtualización de E/S de raíz única (SR-IOV), que proporciona un límite de seguridad respaldado por hardware con un rendimiento predecible para cada máquina virtual. Cada máquina virtual solo puede acceder a los recursos de GPU dedicados a ella y la creación de particiones segura del hardware impide el acceso no autorizado de otras máquinas virtuales.
Windows Server presenta la migración en vivo con particiones de GPU. Hay requisitos específicos para usar la migración en vivo de creación de particiones de GPU. Además de los procedimientos recomendados de migración en vivo, los hosts de clúster deben tener procesadores compatibles con el seguimiento de bits DMA de la unidad de gestión de memoria de entrada y salida (IOMMU). Por ejemplo, los procesadores compatibles con Intel VT-D o AMD-Vi. Si usa Windows Server y la migración en vivo sin procesadores habilitados para IOMMU, las máquinas virtuales se reinician automáticamente donde están disponibles los recursos de GPU.
La partición de GPU está diseñada para servidores independientes. Puede migrar en vivo máquinas virtuales entre nodos independientes durante tiempos de inactividad planificados. Sin embargo, para los clientes que requieren la agrupación en clústeres durante tiempos de inactividad no planificados, debe usar Windows Server 2025 Datacenter.
Cuándo usar la creación de particiones de GPU
Algunas cargas de trabajo, como la infraestructura de escritorio virtual (VDI), la inteligencia artificial (IA) y la inferencia de aprendizaje automático (ML) requieren aceleración de GPU. La partición de GPU puede ayudar a reducir el costo total de propiedad de la infraestructura general.
Por ejemplo:
Aplicaciones VDI: los clientes perimetrales distribuidos ejecutan aplicaciones de productividad básicas, como Microsoft Office y cargas de trabajo de visualización con mucha carga de gráficos en sus entornos de VDI, lo que requiere aceleración de GPU. Para estas cargas de trabajo, puede lograr la aceleración de GPU necesaria a través de particiones de DDA o GPU. Con la creación de particiones de GPU, puede crear varias particiones y asignar cada partición a una máquina virtual que aloja un entorno VDI. La creación de particiones de GPU lo ayuda a lograr la densidad deseada y a escalar la cantidad de usuarios admitidos en un orden de magnitud.
Inferencia con ML: los clientes de tiendas minoristas y plantas de fabricación pueden ejecutar la inferencia en el perímetro, lo que requiere compatibilidad con GPU para sus servidores. Utilizando la GPU en sus servidores, puede ejecutar modelos ML para obtener resultados rápidos sobre los que actuar antes de enviar los datos a la nube. El conjunto de datos completo se puede transferir opcionalmente para continuar entrenando y mejorando los modelos de Machine Learning. Junto con DDA, en el que se asigna una GPU física completa a una máquina virtual, la creación de particiones de GPU permite ejecutar varias aplicaciones de inferencia en paralelo en la misma GPU, pero en particiones físicas separadas, con lo que se aprovecha la GPU al máximo.
Sistemas operativos invitados compatibles
La creación de particiones de GPU en Windows Server 2025 y versiones posteriores es compatible con estos sistemas operativos invitados:
La creación de particiones de GPU en Azure Stack HCI admite estos sistemas operativos invitados:
- Windows 10 o posterior
- Sesión múltiple de Windows 10 Enterprise o superior
- Windows Server 2019 o posterior
- Linux Ubuntu 18.04 LTS, Linux Ubuntu 20.04 LTS, Linux Ubuntu 22.04 LTS
GPU admitidas
Las GPU siguientes admiten la creación de particiones de GPU:
- NVIDIA A2
- NVIDIA A10
- NVIDIA A16
- NVIDIA A40
- NVIDIA L2
- NVIDIA L4
- NVIDIA L40
- NVIDIA L40S
Nota:
El controlador NVIDIA no admite actualmente la partición de GPU para la migración en vivo.
Le recomendamos que trabaje con sus socios fabricantes de equipos originales (OEM) y proveedores de hardware independientes (IHV) de GPU para planificar, encargar y configurar los sistemas para sus cargas de trabajo deseadas con las configuraciones adecuadas y el software necesario. Sin embargo, admitimos más GPU si desea utilizar la aceleración de GPU mediante la asignación discreta de dispositivos (DDA). Póngase en contacto con sus socios de OEM e IHV para obtener una lista de GPU compatibles con DDA. Para obtener más información sobre el uso de la aceleración de GPU a través de DDA, consulte Asignación discreta de dispositivos (DDA).
Para obtener el mejor rendimiento, se recomienda crear una configuración para GPU homogénea en todos los servidores del clúster. Una configuración homogénea consiste en instalar la misma marca y modelo de la GPU y configurar el mismo número de particiones en las GPU en todos los servidores del clúster. Por ejemplo, en un clúster de dos servidores con una o varias GPU instaladas, todas las GPU deben tener la misma marca, modelo y tamaño. El número de particiones de cada GPU también debe coincidir.
Limitaciones
Tenga en cuenta las siguientes limitaciones al usar la función de creación de particiones de GPU:
La creación de particiones de GPU no es compatible si la configuración no es homogénea. Estos son algunos ejemplos de configuraciones no admitidas:
Combinación de GPU de distintos proveedores en el mismo clúster.
Usar diferentes modelos de GPU de diferentes familias de productos del mismo proveedor en el mismo clúster.
No se puede asignar una GPU física como Asignación de dispositivos discretos (DDA) o GPU con particiones. Se puede asignar como DDA o como GPU con particiones, pero no como ambas.
Solo puede asignar una partición de GPU a una máquina virtual.
Las particiones se asignan automáticamente a las máquinas virtuales. No puede elegir una partición específica para una máquina virtual específica.
- Actualmente, la creación de particiones de GPU en Azure Stack HCI no admite la migración en vivo de máquinas virtuales. Sin embargo, las máquinas virtuales se pueden reiniciar y colocar automáticamente donde están disponibles los recursos de GPU si se produce un error.
Puede crear particiones de la GPU con Windows Admin Center o usando PowerShell. Se recomienda usar Windows Admin Center para configurar y asignar particiones de GPU. Windows Admin Center valida automáticamente una configuración homogénea de las GPU en todos los servidores del clúster. Proporciona errores y advertencias adecuadas para realizar cualquier acción correctiva necesaria.
Si usa PowerShell para aprovisionar particiones de GPU, debe realizar los pasos de aprovisionamiento en cada servidor del clúster. Debe asegurarse manualmente de que la configuración homogénea se mantiene para las GPU en todos los servidores del clúster.
- Al migrar en vivo una máquina virtual con una partición de GPU asignada, la migración en vivo de Hyper-V se revierte automáticamente al uso de TCP/IP con compresión. La migración de una máquina virtual tiene el efecto potencial de aumentar el uso de la CPU de un host. Además, las migraciones en vivo podrían tardar más tiempo que con máquinas virtuales sin particiones de GPU.
Contenido relacionado
Para obtener más información sobre el uso de GPU con las máquinas virtuales y la creación de particiones de GPU, consulte:
Para obtener más información sobre el uso de GPU con las máquinas virtuales y la creación de particiones de GPU, consulte: