Delen via


Modellen die beschikbaar zijn in azure AI-modeldeductie

Azure AI-modeldeductie in Azure AI Foundry biedt u toegang tot vlaggenschipmodellen in Azure AI om ze als API's te gebruiken zonder ze te hosten op uw infrastructuur.

Tip

DeepSeek-R1 (preview) is beschikbaar voor implementatie als serverloze API-eindpunt.

Een animatie met de sectie Azure AI Studio-modelcatalogus en de beschikbare modellen.

De beschikbaarheid van modellen verschilt per modelprovider, implementatie-SKU en cloud. Alle modellen die beschikbaar zijn in Azure AI-modeldeductie ondersteunen het wereldwijde standaardimplementatietype dat gebruikmaakt van globale capaciteit om doorvoer te garanderen. Azure OpenAI-modellen ondersteunen ook regionale implementaties en onafhankelijke clouds: Azure Government, Azure Duitsland en Azure China 21Vianet.

Meer informatie over specifieke implementatiemogelijkheden voor Azure OpenAI vindt u in de beschikbaarheid van het Azure OpenAI-model.

Tip

De Azure AI-modelcatalogus biedt een grotere selectie van modellen, van een groter scala aan providers. Voor deze modellen moet u deze echter mogelijk hosten in uw infrastructuur, inclusief het maken van een AI-hub en -project. De Azure AI-modelservice biedt een manier om de modellen als API's te gebruiken zonder deze te hosten op uw infrastructuur, met een facturering per gebruik. Meer informatie over de Azure AI-modelcatalogus.

U kunt alle modellen zien die voor u beschikbaar zijn in de modelcatalogus voor Azure AI Foundry Portal.

AI21 Labs

De Jamba-familiemodellen zijn ai21's op productie gebaseerde Mamba-gebaseerde grote taalmodel (LLM) die gebruikmaakt van de hybride Mamba-Transformer-architectuur van AI21. Het is een instructie-afgestemde versie van het hybride SSM-transformatiemodel van AI21 (Hybrid Structured State Space Model) Jamba-model. De Jamba family modellen zijn gebouwd voor betrouwbaar commercieel gebruik met betrekking tot kwaliteit en prestaties.

Modelleren Type Laag Functies
AI21-Jamba-1.5-Mini chatvoltooiing Algemene standaard - Invoer: tekst (262.144 tokens)
- Uitvoer: (4.096 tokens)
- Talen:en, fr, es, , pt, , de, en arhe
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
AI21-Jamba-1.5-Large chatvoltooiing Algemene standaard - Invoer: tekst (262.144 tokens)
- Uitvoer: (4.096 tokens)
- Talen:en, fr, es, , pt, , de, en arhe
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Azure OpenAI

Azure OpenAI Service biedt een diverse set modellen met verschillende mogelijkheden en prijspunten. Deze modellen zijn onder andere:

  • Geavanceerde modellen die zijn ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden
  • Modellen die natuurlijke taal en code kunnen begrijpen en genereren
  • Modellen die spraak naar tekst kunnen transcriberen en vertalen
Modelleren Type Laag Functies
o1 chatvoltooiing Algemene standaard - Invoer: tekst en afbeelding (200.000 tokens)
- Uitvoer: tekst (100.000 tokens)
- Talen: , , , , es, de, , idfr, ru, pl, , uk, el, arurthbniscyswnetrpakozhlvja, en . mrteafiten
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
o1-preview chatvoltooiing Algemene standaard
Standaard
- Invoer: tekst (128.000 tokens)
- Uitvoer: (32.768 tokens)
- Talen: , , , , es, de, , idfr, ru, pl, , uk, el, arurthbniscyswnetrpakozhlvja, en . mrteafiten
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
o1-mini chatvoltooiing Algemene standaard
Standaard
- Invoer: tekst (128.000 tokens)
- Uitvoer: (65.536 tokens)
- Talen: , , , , es, de, , idfr, ru, pl, , uk, el, arurthbniscyswnetrpakozhlvja, en . mrteafiten
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
gpt-4o-realtime-preview realtime Algemene standaard - Invoer: besturingselement, tekst en audio (131.072 tokens)
- Uitvoer: tekst en audio (16.384 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
gpt-4o chatvoltooiing Algemene standaard
Standaard
Batch
Ingericht
Globaal ingericht
Gegevenszone
- Invoer: tekst en afbeelding (131.072 tokens)
- Uitvoer: tekst (16.384 tokens)
- Talen: , , , , es, de, , idfr, ru, pl, , uk, el, arurthbniscyswnetrpakozhlvja, en . mrteafiten
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
gpt-4o-mini chatvoltooiing Algemene standaard
Standaard
Batch
Ingericht
Globaal ingericht
Gegevenszone
- Invoer: tekst, afbeelding en audio (131.072 tokens)
- Uitvoer: (16.384 tokens)
- Talen: , , , , es, de, , idfr, ru, pl, , uk, el, arurthbniscyswnetrpakozhlvja, en . mrteafiten
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer
tekst-insluiten-3-groot insluitingen Algemene standaard
Standaard
Ingericht
Globaal ingericht
- Invoer: tekst (8.191 tokens)
- Uitvoer: Vector (3.072 dim.)
- Talen:en
tekst-insluiten-3-klein insluitingen Algemene standaard
Standaard
Ingericht
Globaal ingericht
- Invoer: tekst (8.191 tokens)
- Uitvoer: Vector (1.536 dim.)
- Talen:en

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Cohere

De cohere-serie van modellen bevat verschillende modellen die zijn geoptimaliseerd voor verschillende use cases, waaronder voltooiingen van chats en insluitingen. Cohere-modellen zijn geoptimaliseerd voor verschillende gebruiksvoorbeelden, waaronder redenering, samenvatting en antwoord op vragen.

Modelleren Type Laag Functies
Cohere-embed-v3-english insluitingen
afbeeldingen insluiten
Algemene standaard - Invoer: tekst (512 tokens)
- Uitvoer: Vector (1.024 dim.)
- Talen: en
Cohere-embed-v3-meertalige insluitingen
afbeeldingen insluiten
Algemene standaard - Invoer: tekst (512 tokens)
- Uitvoer: Vector (1.024 dim.)
- Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
Cohere-command-r-plus-08-2024 chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Cohere-command-r-08-2024 chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Cohere-command-r-plus chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Cohere-command-r chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Core42

Core42 bevat autoregressieve bi-linguïsele LLM's voor Arabisch en Engels met geavanceerde mogelijkheden in het Arabisch.

Modelleren Type Laag Functies
jais-30b-chat chatvoltooiing Algemene standaard - Invoer: tekst (8.192 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en ar
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Meta

Meta Llama-modellen en -hulpprogramma's zijn een verzameling vooraf getrainde en verfijnde AI-tekst- en afbeeldingsredenmodellen. Het bereik metamodellen is schaal om het volgende op te nemen:

  • Kleine taalmodellen (SLM's) zoals 1B en 3B Base en Instruct-modellen voor deductie op het apparaat en de rand
  • Middelgrote grote taalmodellen (LLM's) zoals 7B, 8B en 70B Base- en Instruct-modellen
  • Krachtige modellen zoals Meta Llama 3.1-405B Instruct for synthetic data generation and distilling use cases.
Modelleren Type Laag Functies
Llama-3.3-70B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen: en, de, fr, it, pt, hi, es en th
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Llama-3.2-11B-Vision-Instruct chatvoltooiing Algemene standaard - Invoer: tekst en afbeelding (128.000 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Llama-3.2-90B-Vision-Instruct chatvoltooiing Algemene standaard - Invoer: tekst en afbeelding (128.000 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Meta-Llama-3.1-405B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en, de, fr, it, pt, hi, es en th
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Meta-Llama-3-8B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (8.192 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Meta-Llama-3.1-70B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en, de, fr, it, pt, hi, es en th
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Meta-Llama-3.1-8B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en, de, fr, it, pt, hi, es en th
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst
Meta-Llama-3-70B-Instruct chatvoltooiing Algemene standaard - Invoer: tekst (8.192 tokens)
- Uitvoer: (8.192 tokens)
- Talen: en
- Aanroepen van hulpprogramma: Nee*
- Antwoordindelingen: Tekst

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Microsoft

Phi is een familie van lichtgewicht, state-of-the-art open modellen. Deze modellen zijn getraind met Phi-3-gegevenssets. De gegevenssets bevatten zowel synthetische gegevens als de gefilterde, openbaar beschikbare websitesgegevens, met een focus op hoogwaardige en redenerende dichte eigenschappen. De modellen hebben een grondig verbeteringsproces ondergaan, waarbij zowel onder supervisie nauwkeurig afstemmen, proximal beleidsoptimalisatie als directe voorkeursoptimalisatie worden opgenomen om nauwkeurige instructies en robuuste veiligheidsmaatregelen te garanderen.

Modelleren Type Laag Functies
Phi-3-mini-128k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3-mini-4k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (4.096 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3-small-8k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3-medium-128k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3-medium-4k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (4.096 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3.5-vision-instruct chatvoltooiing Algemene standaard - Invoer: tekst en afbeelding (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3.5-MoE-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3-small-128k-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-3.5-mini-instruct chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst
Phi-4 chatvoltooiing Algemene standaard - Invoer: tekst (16.384 tokens)
- Uitvoer: (16.384 tokens)
- Talen: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, your, vi, yo, and zh - Tool calling: No
- Antwoordindelingen: Tekst

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

Mistral AI

Mistral AI biedt twee categorieën modellen: premium modellen, waaronder Mistral Large en Mistral Small en open modellen, waaronder Mistral Nemo.

Modelleren Type Laag Functies
Ministral-3B chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: fr, de, es, it, en
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Mistral-large chatvoltooiing Algemene standaard - Invoer: tekst (32.768 tokens)
- Uitvoer: (4.096 tokens)
- Talen: fr, de, es, it, en
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Mistral-small chatvoltooiing Algemene standaard - Invoer: tekst (32.768 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: fr, de, es, it, en
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Mistral-Nemo chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Mistral-large-2407 chatvoltooiing Algemene standaard - Invoer: tekst (131.072 tokens)
- Uitvoer: (4.096 tokens)
- Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Mistral-Large-2411 chatvoltooiing Algemene standaard - Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl
- Aanroepen van hulpprogramma' s: Ja
- Antwoordindelingen: Tekst, JSON
Codestral-2501 chatvoltooiing Algemene standaard - Invoer: tekst (262.144 tokens)
- Uitvoer: tekst (4.096 tokens)
- Talen: en
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst

Bekijk deze modelverzameling in de Azure AI Foundry-portal.

NTT-gegevens

Tsuzumi is een voor autoregressieve taal geoptimaliseerde transformator. De afgestemde versies maken gebruik van SFT (Fine-Tuning onder supervisie). Tsuzumi verwerkt zowel Japans als Engels met hoge efficiëntie.

Modelleren Type Laag Functies
Tsuzumi-7b chatvoltooiing Algemene standaard - Invoer: tekst (8.192 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen: en jp
- Aanroepen van hulpprogramma' s: Nee
- Antwoordindelingen: Tekst

Volgende stappen