Modèles Azure OpenAI Service
Azure OpenAI Service est fourni avec par un ensemble diversifié de modèles proposant des fonctionnalités variées et des prix différents. La disponibilité des modèles varie selon la région. Pour en savoir plus sur les modèles GPT-3 et certains autres mis hors service en juillet 2024, consultez l’articles Modèles Azure OpenAI Service hérités.
Modèles | Description |
---|---|
GPT-4 | Ensemble de modèles qui améliorent GPT-3.5 et qui permettent de comprendre et fr générer du langage naturel et du code. |
GPT-3.5 | Ensemble de modèles qui améliorent GPT-3 et qui permettent de comprendre et de générer du langage naturel et du code. |
Incorporations | Ensemble de modèles qui permettent de convertir du texte en forme vectorielle numérique pour faciliter la similarité du texte. |
DALL-E (préversion) | Série de modèles en avant-première permettant de générer des images originales à partir d’un langage naturel. |
GPT-4
GPT-4 peut résoudre des problèmes difficiles avec une plus grande précision que n’importe lequel des modèles précédents d’OpenAI. Comme GPT-3.5 Turbo, GPT-4 est optimisé pour la conversation, mais fonctionne bien pour les tâches d’achèvement classiques. Utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-4. Pour en savoir plus les interactions avec GPT-4 et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.
En raison de la forte demande, l’accès à cette série de modèles n’est disponible que sur demande pour le moment. Pour demander l’accès, les clients Azure OpenAI existants peuvent s’inscrire en remplissant ce formulaire
gpt-4
gpt-4-32k
Le modèle gpt-4
prend en charge 8 192 jetons d’entrée maximum et le modèle gpt-4-32k
prend en charge jusqu’à 32 768 jetons.
GPT-3.5
Les modèles GPT-3.5 peuvent comprendre et générer un langage naturel ou du code. GPT-3.5 Turbo s’inscrit comme le modèle le plus performant et le plus économique de la famille GPT-3.5. Il a été optimisé pour la conversation et fonctionne également bien pour les tâches traditionnelles de saisie semi-automatique. Nous recommandons d’utiliser GPT-3.5 Turbo plutôt que les modèles GPT-3.5 et GPT-3 hérités.
gpt-35-turbo
gpt-35-turbo-16k
Le modèle gpt-35-turbo
prend en charge 4 096 jetons d’entrée maximum et le modèle gpt-35-turbo-16k
prend en charge jusqu’à 16 384 jetons.
Comme GPT-4, utilisez l’API de saisie semi-automatique de conversation pour utiliser GPT-3.5 Turbo. Pour en savoir plus les interactions avec GPT-3.5 Turbo et l’API de saisie semi-automatique de conversation, consultez la procédure détaillée.
Modèles Incorporations
Important
Nous vous recommandons vivement d’utiliser text-embedding-ada-002 (Version 2)
. Ce modèle/cette version fournit une parité avec text-embedding-ada-002
d’OpenAI. Pour en savoir plus sur les améliorations offertes par ce modèle, veuillez vous reporter au billet de blog d’OpenAI. Même si vous utilisez actuellement la version 1, vous devez migrer vers la version 2 pour tirer parti des dernières pondérations/limites de jetons mises à jour. Les versions 1 et 2 ne sont pas interchangeables. L’incorporation et la recherche de documents doivent donc être effectuées à l’aide de la même version du modèle.
Actuellement, nous proposons trois familles de modèles d’incorporation avec différentes fonctionnalités. La liste suivante indique la longueur du vecteur numérique retourné par le service, en fonction de la fonctionnalité du modèle :
Modèle de base | Modèle(s) | Dimensions |
---|---|---|
Ada | modèles se terminant par -001 (version 1) | 1 024 |
Ada | text-embedding-ada-002 (Version 2) | 1536 |
DALL-E (préversion)
Les modèles DALL-E, actuellement en préversion, génèrent des images à partir des invites de texte que l’utilisateur fournit.
Tableau récapitulatif des modèles et de leur disponibilité par région
Important
USA Centre Sud est temporairement indisponible pour la création de nouvelles ressources en raison d’une forte demande.
Modèles GPT-4
Ces modèles peuvent être utilisés uniquement avec l’API d’achèvement de conversation.
ID de modèle | Régions pour modèle de base | Régions pour optimisation | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|---|---|
gpt-4 1,2 (0314) |
USA Est, France Centre | N/A | 8 192 | Septembre 2021 |
gpt-4-32k 1,2 (0314) |
USA Est, France Centre | N/A | 32,768 | Septembre 2021 |
gpt-4 1 (0613) |
USA Est, France Centre | N/A | 8 192 | Septembre 2021 |
gpt-4-32k 1 (0613) |
USA Est, France Centre | N/A | 32,768 | Septembre 2021 |
1 Le modèle est disponible sur demande uniquement.
2 La version 0314
de GPT-4 et GPT-4-32k sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.
Modèles GPT-3.5
GPT-3.5 Turbo est utilisé avec l’API de saisie semi-automatique de conversation. GPT-3.5 Turbo (0301) peut également être utilisé avec l’API de saisie semi-automatique. GPT3.5 Turbo (0613) prend uniquement en charge l’API de saisie semi-automatique de conversation.
ID de modèle | Régions pour modèle de base | Régions pour optimisation | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|---|---|
gpt-35-turbo 1 (0301) |
USA Est, France Centre, USA Centre Sud, Royaume-Uni Sud, Europe Ouest | N/A | 4 096 | Septembre 2021 |
gpt-35-turbo (0613) |
USA Est, France Centre, Royaume-Uni Sud | N/A | 4 096 | Septembre 2021 |
gpt-35-turbo-16k (0613) |
USA Est, France Centre, Royaume-Uni Sud | N/A | 16 384 | Septembre 2021 |
1 La version 0301
de GPT-35-Turbo sera mise hors service le 4 janvier 2024. Consultez la section Mises à jour des modèles pour connaître le comportement de mise à niveau des modèles.
Modèles Incorporations
Ces modèles peuvent être utilisés uniquement avec des demandes d’API d’incorporation.
Notes
Nous vous recommandons vivement d’utiliser text-embedding-ada-002 (Version 2)
. Ce modèle/cette version fournit une parité avec text-embedding-ada-002
d’OpenAI. Pour en savoir plus sur les améliorations offertes par ce modèle, veuillez vous reporter au billet de blog d’OpenAI. Même si vous utilisez actuellement la version 1, vous devez migrer vers la version 2 pour tirer parti des dernières pondérations/limites de jetons mises à jour. Les versions 1 et 2 ne sont pas interchangeables. L’incorporation et la recherche de documents doivent donc être effectuées à l’aide de la même version du modèle.
ID de modèle | Régions pour modèle de base | Régions pour optimisation | Nbre max. de requêtes (jetons) | Données d’entraînement (date max.) |
---|---|---|---|---|
text-embedding-ada-002 (version 2) | USA Est, USA Centre Sud, Europe Ouest | N/A | 8 191 | Septembre 2021 |
text-embedding-ada-002 (version 1) | USA Est, USA Centre Sud, Europe Ouest | N/A | 2 046 | Septembre 2021 |
Modèles DALL-E (préversion)
ID de modèle | Régions pour modèle de base | Régions pour optimisation | Requête maximale (caractères) | Données d’entraînement (date max.) |
---|---|---|---|---|
dalle2 | USA Est | N/A | 1 000 | N/A |
Utilisation des modèles
Recherche des modèles disponibles
Vous pouvez obtenir la liste des modèles disponibles pour l’inférence et l’optimisation par votre ressource Azure OpenAI en utilisant l’API Liste de modèles.
Mises à jour de modèle
Azure OpenAI prend désormais en charge les mises à jour automatiques pour certains modèles de déploiement. Sur des modèles où la prise en charge des mises à jour automatiques est disponible, une liste déroulante de version de modèle est visible dans Azure OpenAI Studio sous Créer un déploiement et Modifier le déploiement :
Mise à jour automatique vers la valeur par défaut
Lorsque la mise à jour automatique vers la valeur par défaut est sélectionnée, votre modèle de déploiement est automatiquement mis à jour dans les deux semaines suivant la publication d’une nouvelle version.
Si vous vous trouvez encore dans les premières phases de test des modèles basés sur la saisie semi-automatique et la saisie semi-automatique de conversation, nous recommandons de déployer des modèles avec l’option Mise à jour automatique vers la valeur par défaut dès que possible.
Version de modèle spécifique
À mesure que votre utilisation d’Azure OpenAI évolue et que vous commencez à générer et à intégrer des applications, vous souhaiterez probablement contrôler manuellement des mises à jour de modèles afin de pouvoir d’abord tester et valider la cohérence des performances du modèle pour votre cas d’usage antérieur à la mise à niveau.
Lorsque vous sélectionnez une version de modèle spécifique à un déploiement, elle reste celle sélectionnée jusqu’à ce que vous choisissiez d’effectuer vous-même une mise à jour manuelle ou une fois la date de mise hors service du modèle atteinte. À la date de mise hors service, le modèle effectue une mise à niveau automatique vers la version par défaut lors de la mise hors service.
Mise hors service de GPT-35-Turbo 0301 et de GPT-4 0314
Les modèles gpt-35-turbo
(0301
) et gpt-4
(0314
) seront mis hors service le 4 janvier 2024. Lors de la mise hors service, les déploiements sont automatiquement mis à niveau vers la version par défaut à ce moment. Si vous souhaitez que votre déploiement cesse d’accepter des demandes d’achèvement plutôt qu’une mise à niveau, vous pouvez alors définir l’option de mise à niveau du modèle pour qu’elle expire via l’API. Nous publierons des lignes directrices à ce sujet d’après le 1er septembre.
Affichage des dates de dépréciation
Pour les modèles actuellement déployés, à partir d’Azure OpenAI Studio, sélectionnez Déploiements :
Pour afficher les dates de dépréciation/d’expiration pour tous les modèles disponibles d’une région donnée à partir d’Azure OpenAI Studio, sélectionnezOptions de colonne>Modèles> Sélectionnez Ajuster la dépréciation et Inférence de dépréciation :
Mettre à jour des modèles de déploiement & via l’API
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01
Paramètres de chemin d’accès
Paramètre | Type | Requis ? | Description |
---|---|---|---|
acountname |
string | Obligatoire | Nom de votre ressource Azure OpenAI. |
deploymentName |
string | Obligatoire | Nom de déploiement choisi lorsque vous avez déployé un modèle existant ou nom que vous souhaitez donner à un nouveau modèle de déploiement. |
resourceGroupName |
string | Obligatoire | Nom du groupe de ressources associé pour ce modèle de déploiement. |
subscriptionId |
string | Obligatoire | ID d’abonnement de l’abonnement associé. |
api-version |
string | Obligatoire | Version de l’API à utiliser pour cette opération. Cela suit le format AAAA-MM-JJ. |
Versions prises en charge
2023-05-01
Spécification Swagger
Corps de la demande
Il s’agit uniquement d’un sous-ensemble des paramètres disponibles du corps de la demande. Pour obtenir la liste complète des paramètres, consultez la spécification de l’API REST.
Paramètre | Type | Description |
---|---|---|
versionUpgradeOption | String | Options de mise à niveau d’une version du modèle de déploiement :OnceNewDefaultVersionAvailable OnceCurrentVersionExpired NoAutoUpgrade |
capacité | entier | Représente la part de quota que vous affectez à ce déploiement. Une valeur de 1 équivaut à 1 000 jetons par minute (TPM) |
Exemple de requête
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1" \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"Standard","capacity":1},"properties": {"model": {"format": "OpenAI","name": "text-embedding-ada-002","version": "2"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
Notes
Il existe plusieurs façons de générer un jeton d’autorisation. La méthode la plus simple pour le test initial consiste à lancer le service Cloud Shell à partir de https://portal.azure.com. Exécutez ensuite az account get-access-token
. Vous pouvez utiliser ce jeton comme jeton d’autorisation temporaire pour le test d’API.
Exemple de réponse
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/text-embedding-ada-002-test-1",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "text-embedding-ada-002-test-1",
"sku": {
"name": "Standard",
"capacity": 1
},
"properties": {
"model": {
"format": "OpenAI",
"name": "text-embedding-ada-002",
"version": "2"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"capabilities": {
"embeddings": "true",
"embeddingsMaxInputs": "1"
},
"provisioningState": "Succeeded",
"ratelimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 2
},
{
"key": "token",
"renewalPeriod": 60,
"count": 1000
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2023-06-13T00:12:38.885937Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2023-06-13T02:41:04.8410965Z"
},
"etag": "\"{GUID}\""
}