Administrar y aumentar las cuotas de los recursos con Inteligencia artificial de Azure Studio
Importante
Los elementos marcados (versión preliminar) en este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin acuerdo de nivel de servicio y no se recomienda para las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.
La cuota proporciona flexibilidad para administrar activamente la asignación de límites de velocidad en las implementaciones de la suscripción. En este artículo se explica el proceso de administrar la cuota de las máquinas virtuales de Inteligencia artificial de Azure Studio y los modelos de Azure OpenAI.
Azure usa límites y cuotas para evitar rebasamientos presupuestarios por fraudes y para respetar las restricciones de capacidad de Azure. También es una buena manera que tienen los administradores de controlar los costes. Tenga en cuenta estos límites a medida que escala para cargas de trabajo de producción.
En este artículo, aprenderá lo siguiente:
- Límites predeterminados en los recursos de Azure
- Crear cuotas de nivel de centro de Azure AI Studio.
- Visualizar las cuotas y los límites
- Solicitar aumentos de cuota y límite
Consideraciones especiales
Las cuotas se aplican a cada suscripción de la cuenta. Si tiene varias suscripciones, debe solicitar un aumento de cuota para cada suscripción.
Una cuota es un límite de crédito en los recursos de Azure, no una garantía de capacidad. Si tiene necesidades de capacidad a gran escala, póngase en contacto con el soporte técnico de Azure para incrementar la cuota.
Nota:
El proceso de Inteligencia artificial de Azure Studio tiene una cuota independiente de la cuota de proceso principal.
Los límites predeterminados varían según el tipo de categoría de la oferta; por ejemplo, evaluación gratuita, pago por uso, y la serie de la máquina virtual (VM), como Dv2, F y G.
Cuota de Inteligencia artificial de Azure Studio
Las siguientes acciones de Inteligencia artificial de Azure Studio consumen cuota:
- Crear una instancia de proceso.
- Crear un índice vectorial.
- Implementar modelos abiertos desde el catálogo de modelo.
Proceso de Inteligencia artificial de Azure Studio
El proceso de Inteligencia artificial de Azure Studio tiene un límite de cuota predeterminado sobre el número de núcleos y sobre el número de recursos de proceso únicos permitidos por región en una suscripción.
- La cuota del número de núcleos se divide por cada familia de máquinas virtuales y los núcleos totales acumulados.
- La cuota del número de recursos de proceso únicos por región es independiente de la cuota de núcleos de VM, ya que solo se aplica a los recursos de proceso administrados
Para aumentar los límites de proceso, puede solicitar un aumento de cuota en Inteligencia artificial de Azure Studio.
Entre los recursos disponibles se incluyen:
- Los núcleos dedicados por región tienen un límite predeterminado de 24 a 300, según el tipo de oferta de la suscripción. Es posible aumentar el número de núcleos dedicados por suscripción de cada familia de máquinas virtuales. Las familias de máquinas virtuales especializadas, como las series NCv2, NCv3 o ND, comienzan con un valor predeterminado de cero núcleos. Las GPU también se establecen en cero núcleos de manera predeterminada.
- Límite total de proceso por región tiene un límite predeterminado de 500 por región dentro de una suscripción determinada y puede aumentarse hasta un valor máximo de 2500 por región. Este límite se comparte entre las instancias de proceso y las implementaciones de puntos de conexión administrados en línea. Una instancia de proceso se considera un clúster de un solo nodo para los fines de la cuota. Para aumentar el límite total de proceso, abra una solicitud de soporte técnico al cliente en línea.
Al abrir la solicitud de soporte técnico para aumentar el límite total de proceso, proporcione la siguiente información:
Seleccione Técnico para el tipo de problema.
Seleccione la suscripción para la que desea aumentar la cuota.
Seleccione Machine Learning como tipo de servicio.
Seleccione el recurso para el que desea aumentar la cuota.
En el campo Resumen, escriba "Aumentar los límites totales de proceso"
Seleccione el tipo de problema Instancia de proceso y Cuota como subtipo de problema.
Seleccione Siguiente.
En la página Detalles adicionales, proporcione el id. de suscripción, la región, el nuevo límite (entre 500 y 2500) y la justificación comercial para aumentar los límites de proceso totales de la región.
Seleccione Crear para enviar el vale de solicitud de soporte técnico.
Cuota compartida de Inteligencia artificial de Azure Studio
Inteligencia artificial de Azure Studio proporciona un grupo de cuotas compartidas que está disponible para que diferentes usuarios de varias regiones la utilicen simultáneamente. En función de la disponibilidad, los usuarios pueden acceder temporalmente a la cuota del grupo compartido y usar la cuota para realizar pruebas durante un período de tiempo limitado. La duración específica depende del caso de uso. Al usar temporalmente la cuota del grupo de cuotas, ya no es necesario presentar una incidencia de soporte técnico para solicitar un aumento de la cuota a corto plazo ni esperar a que se apruebe la solicitud de cuota para poder continuar con la carga de trabajo.
El uso del grupo de cuotas compartido está disponible para probar la inferencia para Llama-2, Phi, Nemotron, Mistral, Dolly y Deci-DeciLM desde el catálogo de modelos. Solo debe usar la cuota compartida para crear puntos de conexión de prueba temporales, no para puntos de conexión de producción. Para los puntos de conexión de producción, debe solicitar cuota dedicada. La facturación de la cuota compartida se basa en el uso, al igual que la facturación de las familias de máquinas virtuales dedicadas.
Azure Container Instances
Para más información, consulte Límites de Container Instances.
Storage
Azure Storage tiene un límite de 250 cuentas de almacenamiento por región y suscripción. Este límite incluye las cuentas de almacenamiento Estándar y Premium.
Visualización y solicitud de cuotas en Inteligencia artificial de Azure Studio
Use cuotas para administrar la asignación de destino de proceso entre varios centros de Azure AI Studio en la misma suscripción.
De manera predeterminada, todos los centros comparten la misma cuota que la cuota de nivel de suscripción de las familias de máquinas virtuales. Sin embargo, puede establecer una cuota máxima para familias de máquinas virtuales individuales para un control de costes y gobernanza más granulares en los centros en una suscripción. Las cuotas de las familias de máquinas virtuales individuales permiten compartir capacidades y evitar problemas de contención de recursos.
En Estudio de IA de Azure, vaya a la página Inicio y seleccione Cuota del modelo o Cuota de la VM en la sección Administración.
Al seleccionar Cuota del modelo, puede ver la cuota de los modelos en la región de Azure seleccionada. Para solicitar más cuota, seleccione el modelo y, a continuación, seleccione Solicitar cuota.
- Use el botón de alternancia Mostrar todas las cuotas para mostrar toda la cuota o solo la cuota asignada actualmente.
- Use la lista desplegable Agrupar por para agrupar la lista por Tipo de cuota, región y modelo, Tipo de cuota, modelo y región, o Ninguno. La agrupación Ninguno muestra una lista de implementaciones de modelos.
- Expanda las agrupaciones para ver información sobre implementaciones de modelos específicas. Al ver una implementación de modelo, seleccione el icono de lápiz en la columna Asignación de cuota para editar la asignación de cuota de la implementación del modelo.
- Use los gráficos en el lado de la página para ver más detalles sobre el uso de cuotas. Los gráficos son interactivos; al mantener el puntero sobre una sección del gráfico se muestra más información y al seleccionar el gráfico se filtra la lista de modelos. Al seleccionar la leyenda del gráfico, se filtran los datos que se muestran en el gráfico.
- Use el vínculo Azure OpenAI aprovisionado para ver información sobre los modelos aprovisionados, incluida una calculadora de capacidad.
Al seleccionar Cuota de la máquina virtual, puede ver la cuota y el uso de las familias de máquinas virtuales en la región de Azure seleccionada. Para solicitar más cuota, seleccione la familia de máquinas virtuales y, a continuación, seleccione Solicitar cuota.