Modellen die beschikbaar zijn in azure AI-modeldeductie

Artikel
01/30/2025

Azure AI-modeldeductie in Azure AI Foundry biedt u toegang tot vlaggenschipmodellen in Azure AI om ze als API's te gebruiken zonder ze te hosten op uw infrastructuur.

Tip

DeepSeek-R1 (preview) is beschikbaar voor implementatie als serverloze API-eindpunt.

De beschikbaarheid van modellen verschilt per modelprovider, implementatie-SKU en cloud. Alle modellen die beschikbaar zijn in Azure AI-modeldeductie ondersteunen het wereldwijde standaardimplementatietype dat gebruikmaakt van globale capaciteit om doorvoer te garanderen. Azure OpenAI-modellen ondersteunen ook regionale implementaties en onafhankelijke clouds: Azure Government, Azure Duitsland en Azure China 21Vianet.

Meer informatie over specifieke implementatiemogelijkheden voor Azure OpenAI vindt u in de beschikbaarheid van het Azure OpenAI-model.

Tip

De Azure AI-modelcatalogus biedt een grotere selectie van modellen, van een groter scala aan providers. Voor deze modellen moet u deze echter mogelijk hosten in uw infrastructuur, inclusief het maken van een AI-hub en -project. De Azure AI-modelservice biedt een manier om de modellen als API's te gebruiken zonder deze te hosten op uw infrastructuur, met een facturering per gebruik. Meer informatie over de Azure AI-modelcatalogus.

U kunt alle modellen zien die voor u beschikbaar zijn in de modelcatalogus voor Azure AI Foundry Portal.

AI21 Labs

De Jamba-familiemodellen zijn ai21's op productie gebaseerde Mamba-gebaseerde grote taalmodel (LLM) die gebruikmaakt van de hybride Mamba-Transformer-architectuur van AI21. Het is een instructie-afgestemde versie van het hybride SSM-transformatiemodel van AI21 (Hybrid Structured State Space Model) Jamba-model. De Jamba family modellen zijn gebouwd voor betrouwbaar commercieel gebruik met betrekking tot kwaliteit en prestaties.

Modelleren	Type	Laag	Functies
AI21-Jamba-1.5-Mini	chatvoltooiing	Algemene standaard	- Invoer: tekst (262.144 tokens) - Uitvoer: (4.096 tokens) - Talen:`en`, `fr`, `es`, , `pt`, , `de`, en `arhe` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
AI21-Jamba-1.5-Large	chatvoltooiing	Algemene standaard	- Invoer: tekst (262.144 tokens) - Uitvoer: (4.096 tokens) - Talen:`en`, `fr`, `es`, , `pt`, , `de`, en `arhe` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Azure OpenAI

Azure OpenAI Service biedt een diverse set modellen met verschillende mogelijkheden en prijspunten. Deze modellen zijn onder andere:

Geavanceerde modellen die zijn ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden
Modellen die natuurlijke taal en code kunnen begrijpen en genereren
Modellen die spraak naar tekst kunnen transcriberen en vertalen

Modelleren	Type	Laag	Functies
o1	chatvoltooiing	Algemene standaard	- Invoer: tekst en afbeelding (200.000 tokens) - Uitvoer: tekst (100.000 tokens) - Talen: , , , , `es`, `de`, , `idfr`, `ru`, `pl`, , `uk`, `el`, `arurthbniscyswnetrpakozhlvja`, en . `mrteafiten` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
o1-preview	chatvoltooiing	Algemene standaard Standaard	- Invoer: tekst (128.000 tokens) - Uitvoer: (32.768 tokens) - Talen: , , , , `es`, `de`, , `idfr`, `ru`, `pl`, , `uk`, `el`, `arurthbniscyswnetrpakozhlvja`, en . `mrteafiten` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
o1-mini	chatvoltooiing	Algemene standaard Standaard	- Invoer: tekst (128.000 tokens) - Uitvoer: (65.536 tokens) - Talen: , , , , `es`, `de`, , `idfr`, `ru`, `pl`, , `uk`, `el`, `arurthbniscyswnetrpakozhlvja`, en . `mrteafiten` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
gpt-4o-realtime-preview	realtime	Algemene standaard	- Invoer: besturingselement, tekst en audio (131.072 tokens) - Uitvoer: tekst en audio (16.384 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
gpt-4o	chatvoltooiing	Algemene standaard Standaard Batch Ingericht Globaal ingericht Gegevenszone	- Invoer: tekst en afbeelding (131.072 tokens) - Uitvoer: tekst (16.384 tokens) - Talen: , , , , `es`, `de`, , `idfr`, `ru`, `pl`, , `uk`, `el`, `arurthbniscyswnetrpakozhlvja`, en . `mrteafiten` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
gpt-4o-mini	chatvoltooiing	Algemene standaard Standaard Batch Ingericht Globaal ingericht Gegevenszone	- Invoer: tekst, afbeelding en audio (131.072 tokens) - Uitvoer: (16.384 tokens) - Talen: , , , , `es`, `de`, , `idfr`, `ru`, `pl`, , `uk`, `el`, `arurthbniscyswnetrpakozhlvja`, en . `mrteafiten` - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
tekst-insluiten-3-groot	insluitingen	Algemene standaard Standaard Ingericht Globaal ingericht	- Invoer: tekst (8.191 tokens) - Uitvoer: Vector (3.072 dim.) - Talen:`en`
tekst-insluiten-3-klein	insluitingen	Algemene standaard Standaard Ingericht Globaal ingericht	- Invoer: tekst (8.191 tokens) - Uitvoer: Vector (1.536 dim.) - Talen:`en`

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Cohere

De cohere-serie van modellen bevat verschillende modellen die zijn geoptimaliseerd voor verschillende use cases, waaronder voltooiingen van chats en insluitingen. Cohere-modellen zijn geoptimaliseerd voor verschillende gebruiksvoorbeelden, waaronder redenering, samenvatting en antwoord op vragen.

Modelleren	Type	Laag	Functies
Cohere-embed-v3-english	insluitingen afbeeldingen insluiten	Algemene standaard	- Invoer: tekst (512 tokens) - Uitvoer: Vector (1.024 dim.) - Talen: en
Cohere-embed-v3-meertalige	insluitingen afbeeldingen insluiten	Algemene standaard	- Invoer: tekst (512 tokens) - Uitvoer: Vector (1.024 dim.) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
Cohere-command-r-plus-08-2024	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Cohere-command-r-08-2024	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Cohere-command-r-plus	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Cohere-command-r	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Core42

Core42 bevat autoregressieve bi-linguïsele LLM's voor Arabisch en Engels met geavanceerde mogelijkheden in het Arabisch.

Modelleren	Type	Laag	Functies
jais-30b-chat	chatvoltooiing	Algemene standaard	- Invoer: tekst (8.192 tokens) - Uitvoer: (4.096 tokens) - Talen: en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Modelleren	Type	Laag	Functies
Llama-3.3-70B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (128.000 tokens) - Uitvoer: tekst (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Llama-3.2-11B-Vision-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst en afbeelding (128.000 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Llama-3.2-90B-Vision-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst en afbeelding (128.000 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Meta-Llama-3.1-405B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Meta-Llama-3-8B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (8.192 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Meta-Llama-3.1-70B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Meta-Llama-3.1-8B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst
Meta-Llama-3-70B-Instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (8.192 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst

Microsoft

Phi is een familie van lichtgewicht, state-of-the-art open modellen. Deze modellen zijn getraind met Phi-3-gegevenssets. De gegevenssets bevatten zowel synthetische gegevens als de gefilterde, openbaar beschikbare websitesgegevens, met een focus op hoogwaardige en redenerende dichte eigenschappen. De modellen hebben een grondig verbeteringsproces ondergaan, waarbij zowel onder supervisie nauwkeurig afstemmen, proximal beleidsoptimalisatie als directe voorkeursoptimalisatie worden opgenomen om nauwkeurige instructies en robuuste veiligheidsmaatregelen te garanderen.

Modelleren	Type	Laag	Functies
Phi-3-mini-128k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3-mini-4k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (4.096 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3-small-8k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3-medium-128k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3-medium-4k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (4.096 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3.5-vision-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst en afbeelding (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3.5-MoE-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3-small-128k-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-3.5-mini-instruct	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst
Phi-4	chatvoltooiing	Algemene standaard	- Invoer: tekst (16.384 tokens) - Uitvoer: (16.384 tokens) - Talen: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, your, vi, yo, and zh - Tool calling: No - Antwoordindelingen: Tekst

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Mistral AI

Mistral AI biedt twee categorieën modellen: premium modellen, waaronder Mistral Large en Mistral Small en open modellen, waaronder Mistral Nemo.

Modelleren	Type	Laag	Functies
Ministral-3B	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Mistral-large	chatvoltooiing	Algemene standaard	- Invoer: tekst (32.768 tokens) - Uitvoer: (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Mistral-small	chatvoltooiing	Algemene standaard	- Invoer: tekst (32.768 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Mistral-Nemo	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Mistral-large-2407	chatvoltooiing	Algemene standaard	- Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Mistral-Large-2411	chatvoltooiing	Algemene standaard	- Invoer: tekst (128.000 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON
Codestral-2501	chatvoltooiing	Algemene standaard	- Invoer: tekst (262.144 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

NTT-gegevens

Tsuzumi is een voor autoregressieve taal geoptimaliseerde transformator. De afgestemde versies maken gebruik van SFT (Fine-Tuning onder supervisie). Tsuzumi verwerkt zowel Japans als Engels met hoge efficiëntie.

Modelleren	Type	Laag	Functies
Tsuzumi-7b	chatvoltooiing	Algemene standaard	- Invoer: tekst (8.192 tokens) - Uitvoer: tekst (8.192 tokens) - Talen: en jp - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst

Volgende stappen

Ga vandaag aan de slag en implementeer uw eerste model in Azure AI-services

Delen via

Modellen die beschikbaar zijn in azure AI-modeldeductie

AI21 Labs

Azure OpenAI

Cohere

Core42

Meta

Microsoft

Mistral AI

NTT-gegevens

Volgende stappen

Feedback

Aanvullende resources