Gestion et augmentation des quotas de ressources avec Azure AI Studio
Important
Les éléments marqués (préversion) dans cet article sont actuellement en préversion publique. Cette préversion est fournie sans contrat de niveau de service, nous la déconseillons dans des charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.
Le quota offre la flexibilité nécessaire pour activement gérer l’allocation des limites de débit entre les déploiements au sein de votre abonnement. Cet article décrit le processus de gestion du quota pour vos machines virtuelles Azure AI Studio et modèles Azure OpenAI.
Azure utilise des limites et des quotas pour empêcher les dépassements de budget dus à des fraudes et pour respecter les contraintes de capacité d’Azure. C’est également un bon moyen de contrôler les coûts des administrateurs. Tenez compte de ces limites lors de la mise à l’échelle des charges de travail de production.
Cet article porte sur les points suivants :
- Limites par défaut sur les ressources Azure
- Création de quotas au niveau du hub Azure AI Studio.
- Consultation de vos quotas et limites
- Demande d’augmentations de quota et de limite
Considérations spéciales
Des quotas sont appliqués à chaque abonnement de votre compte. Si vous disposez de plusieurs abonnements, vous devez demander une augmentation de quota pour chaque abonnement.
Un quota est une limite de crédit sur les ressources Azure, pas une garantie de capacité. Si vous avez des besoins de capacité à grande échelle, contactez le support Azure pour augmenter votre quota.
Remarque
Le calcul Azure AI Studio dispose d’un quota distinct du quota de calcul principal.
Les limites par défaut varient selon le type de catégorie d’offre, comme Essai gratuit ou Paiement à l’utilisation, et selon la gamme de machine virtuelle (Dv2, F et G).
Quota Azure AI Studio
Les actions suivantes dans Azure AI Studio consomment un quota :
- Créer une instance de calcul.
- Construire un index vectoriel.
- Déploiement de modèles ouverts à partir du catalogue de modèles.
Calcult Azure AI Studio
Le calcul Azure AI Studio a une limite de quota par défaut sur le nombre de cœurs et le nombre de ressources de calcul uniques autorisées par région dans un abonnement.
- Le quota sur le nombre de cœurs est réparti entre chaque famille de machines virtuelles et le nombre total cumulé de cœurs.
- Le quota sur le nombre de ressources de calcul uniques par région est distinct du quota de cœurs par machine virtuelle, car il s’applique uniquement aux ressources de calcul managées
Pour augmenter les limites de calcul, vous pouvez demander une augmentation de quota dans Azure AI Studio.
Les ressources disponibles includent :
- Les cœurs dédiés par région ont une limite par défaut comprise entre 24 et 300 ressources en fonction du type de votre offre d’abonnement. Vous pouvez augmenter le nombre de cœurs dédiés par abonnement pour chaque famille de machines virtuelles. Les familles de machines virtuelles spécialisées comme NCv2, NCv3 ou ND ont une valeur initiale par défaut de zéro cœur. Les GPU ont également une valeur initiale par défaut de zéro cœur.
- La limite de calcul totale par région a une limite par défaut de 500 par région au sein d’un abonnement donné et peut être augmentée jusqu’à une valeur maximale de 2500 par région. Cette limite est partagée entre les instances de calcul et les déploiements de points de terminaison en ligne managés. Une instance de calcul est considérée comme un cluster à nœud unique à des fins de quota. Pour augmenter la limite de calcul totale, ouvrez une demande de support client en ligne.
Lors de l’ouverture de la demande de support pour augmenter la limite de calcul totale, fournissez les informations suivantes :
Sélectionnez Technique pour le type de problème.
Sélectionnez l’abonnement pour lequel vous souhaitez augmenter le quota.
Sélectionnez Machine Learning en tant que type de service.
Sélectionnez la ressource pour lequel vous souhaitez augmenter le quota.
Dans le champ résumé, indiquez « Augmenter les limites de calcul totales »
Sélectionnez Instance de calcul le type de problème et quota comme sous-type de problème.
Cliquez sur Suivant.
Sur la page Détails supplémentaires , indiquez l’ID d’abonnement, la région, la nouvelle limite (entre 500 et 2 500) et la justification métier pour augmenter les limites de calcul totales pour cette région.
Sélectionnez Créer pour envoyer le ticket de demande de support.
Quota partagé Azure AI Studio
Azure AI Studio fournit un pool de quotas partagés qui peut être utilisé simultanément par différents utilisateurs dans différentes régions. En fonction de la disponibilité, les utilisateurs peuvent accéder temporairement au quota depuis le pool partagé et utiliser ce quota pour effectuer des tests pendant une durée limitée. La durée spécifique dépend du cas d’usage. En utilisant temporairement le quota du pool de quotas, vous n’avez plus besoin de créer de ticket de support pour une augmentation de quota à court terme ou d’attendre que votre demande de quota soit approuvée avant de pouvoir poursuivre votre charge de travail.
L’utilisation du pool de quotas partagés est disponible pour tester l’inférence pour les modèles Llama-2, Phi, Nemotron, Mistral, Dolly et Deci-DeciLM dans le catalogue de modèles. Vous ne devez utiliser les quotas partagés que pour créer des points de terminaison de test temporaires, et non des points de terminaison de production. Pour les points de terminaison en production, vous devez demander un quota dédié. La facturation du quota partagé est basée sur l’utilisation, tout comme la facturation pour les familles de machines virtuelles dédiées.
Container Instances
Pour plus d’informations, consultez Limites de Container Instances.
Stockage
Stockage Azure a une limite de 250 comptes de stockage par région et par abonnement. Cette limite comprend à la fois les comptes de stockage Standard et Premium.
Afficher et demander des quotas dans Azure AI Studio
Utilisez des quotas pour gérer l’allocation de cibles de calcul entre plusieurs hubs Azure AI Studio dans le même abonnement.
Par défaut, tous les hubs partagent le même quota que le quota au niveau de l’abonnement pour toutes les familles de machines virtuelles. Toutefois, vous pouvez définir un quota maximal pour les familles de machines virtuelles individuelles pour un contrôle de coût et une gouvernance plus précis sur les hubs d’un abonnement. Les quotas pour les familles de machines virtuelles individuelles vous permettent de partager la capacité et d’éviter les problèmes de contention de ressources.
Dans Azure AI Studio, sélectionnez Centre de gestion dans le menu de gauche.
Sélectionnez Quotas dans le menu de gauche.
Dans la vue par quota, vous pouvez voir le quota pour les modèles dans la région Azure sélectionnée. Pour demander davantage de quotas, sélectionnez le modèle, puis Demander un quota.
- Utilisez le bouton Afficher tous les quotas pour afficher tous les quotas ou uniquement le quota actuellement alloué.
- Utilisez la liste déroulante Regrouper par pour regrouper la liste par Type de quota, Région et Modèle, Quota type, Modèle et Région ou Aucun. Le regroupement Aucun affiche une liste des modèles de déploiement.
- Développez les regroupements pour afficher des informations sur modèles de déploiement spécifiques. Lors de l’affichage d’un modèle de déploiement, sélectionnez l’icône du crayon dans la colonne Allocation de quota pour modifier l’allocation de quota pour le modèle de déploiement.
- Utilisez les graphiques le long de la page pour afficher plus de détails sur l’utilisation du quota. Les graphiques sont interactifs. Pointer une section du graphique affiche plus d’informations et sélectionner le graphique filtre la liste des modèles. La sélection de la légende du graphique filtre les données affichées dans le graphique.
- Utilisez le lien Azure OpenAI approvisionné pour afficher des informations sur les modèles approvisionnés, y compris une calculatrice de capacité.
Lorsque vous sélectionnez le lien Quota de machines virtuelles, vous pouvez consulter le quota et l’utilisation des familles de machines virtuelles dans la région Azure sélectionnée. Pour demander davantage de quota, sélectionnez la famille de machines virtuelles, puis Demander un quota.