Compartir vía


Máquinas virtuales de GPU para dispositivos de GPU de Azure Stack Edge Pro

SE APLICA A: Sí para Pro: SKU de GPUAzure Stack Edge Pro con GPUSí para Pro 2 SKUAzure Stack Edge Pro 2Sí para Pro R SKUAzure Stack Edge Pro R

Las cargas de trabajo con aceleración de GPU en un dispositivo de GPU de Azure Stack Edge Pro requieren una máquina virtual (VM) de GPU. En este artículo se proporciona información general sobre las máquinas virtuales de GPU, incluidos los sistemas operativos compatibles, los controladores de GPU y los tamaños de máquina virtual. También se analizan las opciones de implementación de las máquinas virtuales de GPU que se usan con clústeres de Kubernetes.

Acerca de las máquinas virtuales con GPU

Los dispositivos Azure Stack Edge están equipados con 1 o 2 GPU Tesla T4 o Tensor Core A2 de NVIDIA. Para implementar cargas de trabajo de máquinas virtuales con aceleración de GPU en estos dispositivos, use tamaños de máquina virtual optimizados para GPU. La máquina virtual de GPU elegida debe coincidir con la marca de la GPU en el dispositivo Azure Stack Edge. Para más información, consulte Máquinas virtuales optimizadas para GPU compatibles de la serie N.

Para aprovechar las funcionalidades de GPU de las máquinas virtuales de la serie N de Azure, se deben instalar los controladores de GPU de Nvidia. La extensión del controlador de GPU de Nvidia instala los controladores CUDA o GRID de Nvidia adecuados. Puede instalar las extensiones de GPU mediante plantillas o a través de Azure Portal.

Puede instalar y administrar la extensión mediante las plantillas de Azure Resource Manager después de implementar una máquina virtual. En Azure Portal, puede instalar la extensión de GPU mientras implementa una máquina virtual o después de hacerlo. Para obtener instrucciones, consulte Implementación de máquinas virtuales de GPU en el dispositivo de Azure Stack Edge.

Si el dispositivo tiene configurado un clúster de Kubernetes, asegúrese de revisar las consideraciones de implementación de los clústeres de Kubernetes antes de implementar máquinas virtuales de GPU.

Sistema operativo y controladores de GPU admitidos

Las extensiones de controlador de GPU de Nvidia para Windows y Linux admiten las siguientes versiones del sistema operativo.

Sistema operativo admitido para la extensión de GPU para Windows

Esta extensión admite los siguientes sistemas operativos. Otras versiones pueden funcionar, pero no se han probado internamente en máquinas virtuales con GPU que se ejecutan en dispositivos Azure Stack Edge.

Distribución Versión
Windows Server 2019 Core
Windows Server 2016 Core

Sistema operativo admitido para la extensión de GPU para Linux

Esta extensión admite la siguiente distribución del sistema operativo, en función de la compatibilidad del controlador para la versión específica del sistema operativo. Otras versiones pueden funcionar, pero no se han probado internamente en máquinas virtuales con GPU que se ejecutan en dispositivos Azure Stack Edge.

Distribución Versión
Red Hat Enterprise Linux 7.4

Nota:

La extensión de GPU Ubuntu 18.04 LTS ha quedado en desuso. La extensión de GPU ya no se admite en máquinas virtuales de GPU Ubuntu 18.04 que se ejecutan en dispositivos Azure Stack Edge. Si tiene previsto usar la distribución Ubuntu versión 18.04 LTS, consulte los pasos para la instalación manual del controlador de GPU en Descargas de CUDA Toolkit 12.1 Actualización 1. Es posible que tenga que descargar la clave de firma de CUDA antes de la instalación. Para obtener un ejemplo de instalación de la clave de firma, consulte Solución de problemas de extensión de GPU para VM de GPU en GPU de Azure Stack Edge Pro.

Implementación de máquina virtual de GPU

Puede implementar una máquina virtual de GPU a través de Azure Portal o mediante plantillas de Azure Resource Manager. La extensión de GPU se instala después de que se cree la máquina virtual.

Máquinas virtuales con GPU y Kubernetes

Antes de implementar máquinas virtuales con GPU en el dispositivo y, si Kubernetes está configurado en el dispositivo, revise las siguientes consideraciones.

Para un dispositivo con 1 GPU:

  • Creación de una máquina virtual con GPU seguida de la configuración de Kubernetes en el dispositivo: en este escenario, la creación de máquinas virtuales de GPU y la configuración de Kubernetes se realizarán correctamente. Kubernetes no tendrá acceso a la GPU en este caso.

  • Configuración de Kubernetes en el dispositivo seguido de la creación de una máquina virtual de GPU: en este escenario, Kubernetes reclama la GPU del dispositivo y se producirá un error en la creación de la máquina virtual, ya que no hay ningún recurso de GPU disponible.

Para un dispositivo con 2 GPU:

  • Creación de una máquina virtual con GPU seguida de la configuración de Kubernetes en el dispositivo: en este escenario, la máquina virtual con GPU que cree reclamará una GPU del dispositivo y la configuración de Kubernetes también se realizará correctamente y reclamará la GPU restante.

  • Creación de dos máquinas virtuales de GPU seguidas de la configuración de Kubernetes en el dispositivo: en este escenario, las dos máquinas virtuales con GPU reclaman las dos GPU del dispositivo y Kubernetes se configurará correctamente sin GPU.

  • Configuración de Kubernetes en el dispositivo seguido de la creación de una máquina virtual de GPU: en este escenario, las notificaciones de Kubernetes tanto las GPU en el dispositivo como la creación de la máquina virtual producirán un error, ya que no hay recursos de GPU disponibles.

Pasos siguientes