Partager via


Modèles disponibles dans l’inférence de modèle Azure AI

L’inférence de modèle Azure AI dans Azure AI Foundry vous permet d’accéder aux modèles phares d’Azure AI pour les consommer en tant qu’API sans les héberger sur votre infrastructure.

Animation montrant la section du catalogue de modèles Azure AI Studio et les modèles disponibles.

La disponibilité des modèles varie selon le fournisseur de modèles, la référence SKU de déploiement et le cloud. Tous les modèles disponibles dans l’inférence de modèle Azure AI prennent en charge le type de déploiement Standard global qui utilise la capacité globale pour garantir le débit. Les modèles Azure OpenAI prennent également en charge les déploiements régionaux et les clouds souverains, Azure Government, Azure Allemagne et Azure China 21Vianet.

Pour en savoir plus sur les fonctionnalités de déploiement spécifiques pour Azure OpenAI, consultez Disponibilité du modèle Azure OpenAI.

Conseil

Le catalogue de modèles Azure AI offre un plus grand choix de modèles, à partir d’une plus large gamme de fournisseurs. Toutefois, ces modèles peuvent nécessiter d’être hébergés sur votre infrastructure, notamment la création d’un hub et d’un projet IA. Le service de modèles Azure AI permet de consommer les modèles en tant qu’API sans les héberger sur votre infrastructure, avec une facturation à l’utilisation. En savoir plus sur le Catalogue de modèles Azure AI.

Vous pouvez voir tous les modèles disponibles dans le catalogue de modèles du portail Azure AI Foundry.

Laboratoires AI21

La famille de modèles Jamba est un grand modèle de langage (LLM) produit en série basé sur Mamba d’AI21, qui utilise l’architecture hybride Mamba-Transformer d’AI21. Il s’agit d’une version paramétrée par des instructions du modèle SSM (State Space Model) Jamba Transformer hybride structuré d’AI21. Les modèles de famille Jamba sont conçus pour une utilisation commerciale fiable en ce qui concerne la qualité et la performance.

Modèle Type Niveau Fonctionnalités
AI21-Jamba-1.5-Mini chat-completion Standard global - Entrée : texte (262 144 jetons)
- Sortie : (4 096 jetons)
- Langues :en, fr, es, pt, de, ar et he
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
AI21-Jamba-1.5-Large chat-completion Standard global - Entrée : texte (262 144 jetons)
- Sortie : (4 096 jetons)
- Langues :en, fr, es, pt, de, ar et he
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées

Voir cette collection de modèles dans le portail Azure AI Foundry.

Azure OpenAI

Azure OpenAI Service offre un ensemble diversifié de modèles avec des fonctionnalités variées et à des prix différents. Ces modèles comprennent les éléments suivants :

  • Modèles sophistiqués conçus pour traiter des tâches de raisonnement et de résolution de problèmes avec un focus et une capacité accrus
  • Modèles qui peuvent comprendre et générer du langage naturel et du code
  • Modèles qui peuvent transcrire et traduire une reconnaissance vocale
Modèle Type Niveau Fonctionnalités
o1 chat-completion Standard global - Entrée : texte et image (200 000 jetons)
- Sortie : texte (100 000 jetons)
- Langues :en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr et te.
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
o1-preview chat-completion Standard global
Standard
- Entrée : texte (128 000 jetons)
- Sortie : (32 768 jetons)
- Langues :en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr et te.
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
o1-mini chat-completion Standard global
Standard
- Entrée : texte (128 000 jetons)
- Sortie : (65 536 jetons)
- Langues :en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr et te.
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
gpt-4o-realtime-preview real-time Standard global - Entrée : contrôle, texte et audio (131 072 jetons)
- Sortie : texte et audio (16 384 jetons)
- Langues : en
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
gpt-4o chat-completion Standard global
Standard
Batch
approvisionné
Approvisionné global
Zones de données
- Entrée : texte et image (131 072 jetons)
- Sortie : texte (16 384 jetons)
- Langues :en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr et te.
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
gpt-4o-mini chat-completion Standard global
Standard
Batch
approvisionné
Approvisionné global
Zones de données
- Entrée : texte, image et audio (131 072 jetons)
- Sortie : (16 384 jetons)
- Langues :en, it, af, es, de, fr, id, ru, pl, uk, el, lv, zh, ar, tr, ja, sw, cy, ko, is, bn, ur, ne, th, pa, mr et te.
- Appel de l’outil : Oui
- Formats de réponse : Texte, JSON, sorties structurées
text-embedding-3-large incorporations Standard global
Standard
approvisionné
Approvisionné global
- Entrée : texte (8 191 jetons)
- Sortie: Vecteur (dim. 3 072)
- Langues :en
text-embedding-3-small incorporations Standard global
Standard
approvisionné
Approvisionné global
- Entrée : texte (8 191 jetons)
- Sortie : Vecteur (dim. 1 536)
- Langues :en

Voir cette collection de modèles dans le portail Azure AI Foundry.

Cohere

La famille de modèles Cohere inclut divers modèles optimisés pour différents cas d’usage, notamment les complétions de conversation et les incorporations. Les modèles Cohere sont optimisés pour différents cas d’usage qui incluent le raisonnement, le résumé et la réponse aux questions.

Modèle Type Niveau Fonctionnalités
Cohere-embed-v3-english incorporations
incorporations-image
Standard global - Entrée : texte (512 jetons)
- Sortie : Vecteur (dim. 1 024)
- Langues : en
Cohere-embed-v3-multilingual incorporations
incorporations-image
Standard global - Entrée : texte (512 jetons)
- Sortie : Vecteur (dim. 1 024)
- Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar
Cohere-command-r-plus-08-2024 chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Cohere-command-r-08-2024 chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Cohere-command-r-plus chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Cohere-command-r chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, fr, es, it, de, pt-br, ja, ko, zh-cn et ar
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON

Voir cette collection de modèles dans le portail Azure AI Foundry.

Core42

Core42 inclut des LLM bilingues autorégressifs pour l’arabe et l’anglais avec des fonctionnalités sophistiquées en arabe.

Modèle Type Niveau Fonctionnalités
jais-30b-chat chat-completion Standard global - Entrée : texte (8 192 jetons)
- Sortie : (4 096 jetons)
- Langues : en et ar
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON

Voir cette collection de modèles dans le portail Azure AI Foundry.

Méta

Les modèles et outils Meta Llama font partie d’une collection de modèles de raisonnement de texte et d’image d’IA générative préentraînés et affinés. La plage de modèles Meta est mise à l’échelle pour inclure :

  • Des petits modèles de langage (SLM) tels que les modèles 1B et 3B Base et Instruct pour une inférence sur appareil et en périphérie
  • Des grands modèles de langage (LLM) de taille moyenne tels que les modèles 7B, 8B et 70B Base et Instruct
  • Des modèles de haut niveau de performance tels que Meta Llama 3.1-405B Instruct pour des cas d’usage tels que la génération de données synthétiques et la distillation.
Modèle Type Niveau Fonctionnalités
Llama-3.3-70B-Instruct chat-completion Standard global - Entrée : texte (128 000 jetons)
- Sortie : texte (8 192 jetons)
- Langues : en, de, fr, it, pt, hi, es et th
- Appel de l’outil : Non*
- Formats de réponse : Texte
Llama-3.2-11B-Vision-Instruct chat-completion Standard global - Entrée : texte et image (128 000 jetons)
- Sortie : (8 192 jetons)
- Langues : en
- Appel de l’outil : Non*
- Formats de réponse : Texte
Llama-3.2-90B-Vision-Instruct chat-completion Standard global - Entrée : texte et image (128 000 jetons)
- Sortie : (8 192 jetons)
- Langues : en
- Appel de l’outil : Non*
- Formats de réponse : Texte
Meta-Llama-3.1-405B-Instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (8 192 jetons)
- Langues : en, de, fr, it, pt, hi, es et th
- Appel de l’outil : Non*
- Formats de réponse : Texte
Meta-Llama-3-8B-Instruct chat-completion Standard global - Entrée : texte (8 192 jetons)
- Sortie : (8 192 jetons)
- Langues : en
- Appel de l’outil : Non*
- Formats de réponse : Texte
Meta-Llama-3.1-70B-Instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (8 192 jetons)
- Langues : en, de, fr, it, pt, hi, es et th
- Appel de l’outil : Non*
- Formats de réponse : Texte
Meta-Llama-3.1-8B-Instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (8 192 jetons)
- Langues : en, de, fr, it, pt, hi, es et th
- Appel de l’outil : Non*
- Formats de réponse : Texte
Meta-Llama-3-70B-Instruct chat-completion Standard global - Entrée : texte (8 192 jetons)
- Sortie : (8 192 jetons)
- Langues : en
- Appel de l’outil : Non*
- Formats de réponse : Texte

Voir cette collection de modèles dans le portail Azure AI Foundry.

Microsoft

Phi est une famille de modèles ouverts, légers et sophistiqués. Ces modèles ont été entraînés avec des jeux de données Phi-3. Les jeux de données incluent des données synthétiques et des données filtrées de sites web disponibles publiquement, avec un focus sur des propriétés de haute qualité et denses en raisonnement. Les modèles ont subi un processus d’amélioration rigoureux, incorporant à la fois l’ajustement supervisé, l’optimisation des stratégies de proximité et l’optimisation des préférences directes afin de garantir une adhérence précise aux instructions et des mesures de sécurité robustes.

Modèle Type Niveau Fonctionnalités
Phi-3-mini-128k-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3-mini-4k-instruct chat-completion Standard global - Entrée : texte (4 096 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3-small-8k-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3-medium-128k-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3-medium-4k-instruct chat-completion Standard global - Entrée : texte (4 096 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3.5-vision-instruct chat-completion Standard global - Entrée : texte et image (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3.5-MoE-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : texte (4 096 jetons)
- Langues : en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr et uk
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3-small-128k-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-3.5-mini-instruct chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr et uk
- Appel de l’outil : Non
- Formats de réponse : Texte
Phi-4 chat-completion Standard global - Entrée : texte (16 384 jetons)
- Sortie : (16 384 jetons)
- Langues : en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, vi, yo et zh - Appel de l’outil : Non
- Formats de réponse : Texte

Voir cette collection de modèles dans le portail Azure AI Foundry.

Mistral AI

Mistral AI propose deux catégories de modèles, des modèles premium, notamment Mistral Large et Mistral Small, et des modèles ouverts, notamment Mistral Nemo.

Modèle Type Niveau Fonctionnalités
Ministral-3B chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : texte (4 096 jetons)
- Langues : fr, de, es, it et en
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Mistral-large chat-completion Standard global - Entrée : texte (32 768 jetons)
- Sortie : (4 096 jetons)
- Langues : fr, de, es, it et en
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Mistral-small chat-completion Standard global - Entrée : texte (32 768 jetons)
- Sortie : texte (4 096 jetons)
- Langues : fr, de, es, it et en
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Mistral-Nemo chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : texte (4 096 jetons)
- Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Mistral-large-2407 chat-completion Standard global - Entrée : texte (131 072 jetons)
- Sortie : (4 096 jetons)
- Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Mistral-Large-2411 chat-completion Standard global - Entrée : texte (128 000 jetons)
- Sortie : texte (4 096 jetons)
- Langues : en, fr, de, es, it, zh, ja, ko, pt, nl et pl
- Appel de l’outil : Oui
- Formats de réponse: Texte, JSON
Codestral-2501 chat-completion Standard global - Entrée : texte (262 144 jetons)
- Sortie : texte (4 096 jetons)
- Langues : en
- Appel de l’outil : Non
- Formats de réponse : Texte

Voir cette collection de modèles dans le portail Azure AI Foundry.

Données NTT

Tsuzumi est un transformateur optimisé en langage autorégressif. Les versions paramétrées utilisent le réglage précis supervisé (SFT). Tsuzumi gère le japonais et l’anglais avec une grande efficacité.

Modèle Type Niveau Fonctionnalités
Tsuzumi-7b chat-completion Standard global - Entrée : texte (8 192 jetons)
- Sortie : texte (8 192 jetons)
- Langues : en et jp
- Appel de l’outil : Non
- Formats de réponse : Texte

Étapes suivantes