Modèles disponibles dans l’inférence de modèle Azure AI
L’inférence de modèle Azure AI dans Azure AI Foundry vous permet d’accéder aux modèles phares d’Azure AI pour les consommer en tant qu’API sans les héberger sur votre infrastructure.
La disponibilité des modèles varie selon le fournisseur de modèles, la référence SKU de déploiement et le cloud. Tous les modèles disponibles dans l’inférence de modèle Azure AI prennent en charge le type de déploiement Standard global qui utilise la capacité globale pour garantir le débit. Les modèles Azure OpenAI prennent également en charge les déploiements régionaux et les clouds souverains, Azure Government, Azure Allemagne et Azure China 21Vianet.
Pour en savoir plus sur les fonctionnalités de déploiement spécifiques pour Azure OpenAI, consultez Disponibilité du modèle Azure OpenAI.
Conseil
Le catalogue de modèles Azure AI offre un plus grand choix de modèles, à partir d’une plus large gamme de fournisseurs. Toutefois, ces modèles peuvent nécessiter d’être hébergés sur votre infrastructure, notamment la création d’un hub et d’un projet IA. Le service de modèles Azure AI permet de consommer les modèles en tant qu’API sans les héberger sur votre infrastructure, avec une facturation à l’utilisation. En savoir plus sur le Catalogue de modèles Azure AI.
Vous pouvez voir tous les modèles disponibles dans le catalogue de modèles du portail Azure AI Foundry.
Laboratoires AI21
La famille de modèles Jamba est un grand modèle de langage (LLM) produit en série basé sur Mamba d’AI21, qui utilise l’architecture hybride Mamba-Transformer d’AI21. Il s’agit d’une version paramétrée par des instructions du modèle SSM (State Space Model) Jamba Transformer hybride structuré d’AI21. Les modèles de famille Jamba sont conçus pour une utilisation commerciale fiable en ce qui concerne la qualité et la performance.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
AI21-Jamba-1.5-Mini | chat-completion | Standard global |
-
Entrée : texte (262 144 jetons) - Sortie : (4 096 jetons) - Langues : en , fr , es , pt , de , ar et he - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
AI21-Jamba-1.5-Large | chat-completion | Standard global |
-
Entrée : texte (262 144 jetons) - Sortie : (4 096 jetons) - Langues : en , fr , es , pt , de , ar et he - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Azure OpenAI
Azure OpenAI Service offre un ensemble diversifié de modèles avec des fonctionnalités variées et à des prix différents. Ces modèles comprennent les éléments suivants :
- Modèles sophistiqués conçus pour traiter des tâches de raisonnement et de résolution de problèmes avec un focus et une capacité accrus
- Modèles qui peuvent comprendre et générer du langage naturel et du code
- Modèles qui peuvent transcrire et traduire une reconnaissance vocale
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
o1 | chat-completion | Standard global |
-
Entrée : texte et image (200 000 jetons) - Sortie : texte (100 000 jetons) - Langues : en , it , af , es , de , fr , id , ru , pl , uk , el , lv , zh , ar , tr , ja , sw , cy , ko , is , bn , ur , ne , th , pa , mr et te . - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
o1-preview | chat-completion | Standard global Standard |
-
Entrée : texte (128 000 jetons) - Sortie : (32 768 jetons) - Langues : en , it , af , es , de , fr , id , ru , pl , uk , el , lv , zh , ar , tr , ja , sw , cy , ko , is , bn , ur , ne , th , pa , mr et te . - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
o1-mini | chat-completion | Standard global Standard |
-
Entrée : texte (128 000 jetons) - Sortie : (65 536 jetons) - Langues : en , it , af , es , de , fr , id , ru , pl , uk , el , lv , zh , ar , tr , ja , sw , cy , ko , is , bn , ur , ne , th , pa , mr et te . - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
gpt-4o-realtime-preview | real-time | Standard global |
-
Entrée : contrôle, texte et audio (131 072 jetons) - Sortie : texte et audio (16 384 jetons) - Langues : en - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
gpt-4o | chat-completion | Standard global Standard Batch approvisionné Approvisionné global Zones de données |
-
Entrée : texte et image (131 072 jetons) - Sortie : texte (16 384 jetons) - Langues : en , it , af , es , de , fr , id , ru , pl , uk , el , lv , zh , ar , tr , ja , sw , cy , ko , is , bn , ur , ne , th , pa , mr et te . - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
gpt-4o-mini | chat-completion | Standard global Standard Batch approvisionné Approvisionné global Zones de données |
-
Entrée : texte, image et audio (131 072 jetons) - Sortie : (16 384 jetons) - Langues : en , it , af , es , de , fr , id , ru , pl , uk , el , lv , zh , ar , tr , ja , sw , cy , ko , is , bn , ur , ne , th , pa , mr et te . - Appel de l’outil : Oui - Formats de réponse : Texte, JSON, sorties structurées |
text-embedding-3-large | incorporations | Standard global Standard approvisionné Approvisionné global |
-
Entrée : texte (8 191 jetons) - Sortie: Vecteur (dim. 3 072) - Langues : en |
text-embedding-3-small | incorporations | Standard global Standard approvisionné Approvisionné global |
-
Entrée : texte (8 191 jetons) - Sortie : Vecteur (dim. 1 536) - Langues : en |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Cohere
La famille de modèles Cohere inclut divers modèles optimisés pour différents cas d’usage, notamment les complétions de conversation et les incorporations. Les modèles Cohere sont optimisés pour différents cas d’usage qui incluent le raisonnement, le résumé et la réponse aux questions.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
Cohere-embed-v3-english | incorporations incorporations-image |
Standard global |
-
Entrée : texte (512 jetons) - Sortie : Vecteur (dim. 1 024) - Langues : en |
Cohere-embed-v3-multilingual | incorporations incorporations-image |
Standard global |
-
Entrée : texte (512 jetons) - Sortie : Vecteur (dim. 1 024) - Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar |
Cohere-command-r-plus-08-2024 | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Cohere-command-r-08-2024 | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Cohere-command-r-plus | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Cohere-command-r | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Core42
Core42 inclut des LLM bilingues autorégressifs pour l’arabe et l’anglais avec des fonctionnalités sophistiquées en arabe.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
jais-30b-chat | chat-completion | Standard global |
-
Entrée : texte (8 192 jetons) - Sortie : (4 096 jetons) - Langues : en et ar - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Méta
Les modèles et outils Meta Llama font partie d’une collection de modèles de raisonnement de texte et d’image d’IA générative préentraînés et affinés. La plage de modèles Meta est mise à l’échelle pour inclure :
- Des petits modèles de langage (SLM) tels que les modèles 1B et 3B Base et Instruct pour une inférence sur appareil et en périphérie
- Des grands modèles de langage (LLM) de taille moyenne tels que les modèles 7B, 8B et 70B Base et Instruct
- Des modèles de haut niveau de performance tels que Meta Llama 3.1-405B Instruct pour des cas d’usage tels que la génération de données synthétiques et la distillation.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
Llama-3.3-70B-Instruct | chat-completion | Standard global |
-
Entrée : texte (128 000 jetons) - Sortie : texte (8 192 jetons) - Langues : en, de, fr, it, pt, hi, es et th - Appel de l’outil : Non* - Formats de réponse : Texte |
Llama-3.2-11B-Vision-Instruct | chat-completion | Standard global |
-
Entrée : texte et image (128 000 jetons) - Sortie : (8 192 jetons) - Langues : en - Appel de l’outil : Non* - Formats de réponse : Texte |
Llama-3.2-90B-Vision-Instruct | chat-completion | Standard global |
-
Entrée : texte et image (128 000 jetons) - Sortie : (8 192 jetons) - Langues : en - Appel de l’outil : Non* - Formats de réponse : Texte |
Meta-Llama-3.1-405B-Instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (8 192 jetons) - Langues : en, de, fr, it, pt, hi, es et th - Appel de l’outil : Non* - Formats de réponse : Texte |
Meta-Llama-3-8B-Instruct | chat-completion | Standard global |
-
Entrée : texte (8 192 jetons) - Sortie : (8 192 jetons) - Langues : en - Appel de l’outil : Non* - Formats de réponse : Texte |
Meta-Llama-3.1-70B-Instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (8 192 jetons) - Langues : en, de, fr, it, pt, hi, es et th - Appel de l’outil : Non* - Formats de réponse : Texte |
Meta-Llama-3.1-8B-Instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (8 192 jetons) - Langues : en, de, fr, it, pt, hi, es et th - Appel de l’outil : Non* - Formats de réponse : Texte |
Meta-Llama-3-70B-Instruct | chat-completion | Standard global |
-
Entrée : texte (8 192 jetons) - Sortie : (8 192 jetons) - Langues : en - Appel de l’outil : Non* - Formats de réponse : Texte |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Microsoft
Phi est une famille de modèles ouverts, légers et sophistiqués. Ces modèles ont été entraînés avec des jeux de données Phi-3. Les jeux de données incluent des données synthétiques et des données filtrées de sites web disponibles publiquement, avec un focus sur des propriétés de haute qualité et denses en raisonnement. Les modèles ont subi un processus d’amélioration rigoureux, incorporant à la fois l’ajustement supervisé, l’optimisation des stratégies de proximité et l’optimisation des préférences directes afin de garantir une adhérence précise aux instructions et des mesures de sécurité robustes.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
Phi-3-mini-128k-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3-mini-4k-instruct | chat-completion | Standard global |
-
Entrée : texte (4 096 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3-small-8k-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3-medium-128k-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3-medium-4k-instruct | chat-completion | Standard global |
-
Entrée : texte (4 096 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3.5-vision-instruct | chat-completion | Standard global |
-
Entrée : texte et image (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3.5-MoE-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : texte (4 096 jetons) - Langues : en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr et uk - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3-small-128k-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-3.5-mini-instruct | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr et uk - Appel de l’outil : Non - Formats de réponse : Texte |
Phi-4 | chat-completion | Standard global |
-
Entrée : texte (16 384 jetons) - Sortie : (16 384 jetons) - Langues : en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yo et zh - Appel de l’outil : Non - Formats de réponse : Texte |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Mistral AI
Mistral AI propose deux catégories de modèles, des modèles premium, notamment Mistral Large et Mistral Small, et des modèles ouverts, notamment Mistral Nemo.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
Ministral-3B | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : texte (4 096 jetons) - Langues : fr, de, es, it et en - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Mistral-large | chat-completion | Standard global |
-
Entrée : texte (32 768 jetons) - Sortie : (4 096 jetons) - Langues : fr, de, es, it et en - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Mistral-small | chat-completion | Standard global |
-
Entrée : texte (32 768 jetons) - Sortie : texte (4 096 jetons) - Langues : fr, de, es, it et en - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Mistral-Nemo | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : texte (4 096 jetons) - Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Mistral-large-2407 | chat-completion | Standard global |
-
Entrée : texte (131 072 jetons) - Sortie : (4 096 jetons) - Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Mistral-Large-2411 | chat-completion | Standard global |
-
Entrée : texte (128 000 jetons) - Sortie : texte (4 096 jetons) - Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl - Appel de l’outil : Oui - Formats de réponse: Texte, JSON |
Codestral-2501 | chat-completion | Standard global |
-
Entrée : texte (262 144 jetons) - Sortie : texte (4 096 jetons) - Langues : en - Appel de l’outil : Non - Formats de réponse : Texte |
Voir cette collection de modèles dans le portail Azure AI Foundry.
Données NTT
Tsuzumi est un transformateur optimisé en langage autorégressif. Les versions paramétrées utilisent le réglage précis supervisé (SFT). Tsuzumi gère le japonais et l’anglais avec une grande efficacité.
Modèle | Type | Niveau | Fonctionnalités |
---|---|---|---|
Tsuzumi-7b | chat-completion | Standard global |
-
Entrée : texte (8 192 jetons) - Sortie : texte (8 192 jetons) - Langues : en et jp - Appel de l’outil : Non - Formats de réponse : Texte |
Étapes suivantes
- Démarrez aujourd’hui et déployez votre premier modèle dans Azure AI services