Modellen die beschikbaar zijn in azure AI-modeldeductie
Azure AI-modeldeductie in Azure AI Foundry biedt u toegang tot vlaggenschipmodellen in Azure AI om ze als API's te gebruiken zonder ze te hosten op uw infrastructuur.
Tip
DeepSeek-R1 (preview) is beschikbaar voor implementatie als serverloze API-eindpunt.
De beschikbaarheid van modellen verschilt per modelprovider, implementatie-SKU en cloud. Alle modellen die beschikbaar zijn in Azure AI-modeldeductie ondersteunen het wereldwijde standaardimplementatietype dat gebruikmaakt van globale capaciteit om doorvoer te garanderen. Azure OpenAI-modellen ondersteunen ook regionale implementaties en onafhankelijke clouds: Azure Government, Azure Duitsland en Azure China 21Vianet.
Meer informatie over specifieke implementatiemogelijkheden voor Azure OpenAI vindt u in de beschikbaarheid van het Azure OpenAI-model.
Tip
De Azure AI-modelcatalogus biedt een grotere selectie van modellen, van een groter scala aan providers. Voor deze modellen moet u deze echter mogelijk hosten in uw infrastructuur, inclusief het maken van een AI-hub en -project. De Azure AI-modelservice biedt een manier om de modellen als API's te gebruiken zonder deze te hosten op uw infrastructuur, met een facturering per gebruik. Meer informatie over de Azure AI-modelcatalogus.
U kunt alle modellen zien die voor u beschikbaar zijn in de modelcatalogus voor Azure AI Foundry Portal.
AI21 Labs
De Jamba-familiemodellen zijn ai21's op productie gebaseerde Mamba-gebaseerde grote taalmodel (LLM) die gebruikmaakt van de hybride Mamba-Transformer-architectuur van AI21. Het is een instructie-afgestemde versie van het hybride SSM-transformatiemodel van AI21 (Hybrid Structured State Space Model) Jamba-model. De Jamba family modellen zijn gebouwd voor betrouwbaar commercieel gebruik met betrekking tot kwaliteit en prestaties.
Modelleren | Type | Laag | Functies |
---|---|---|---|
AI21-Jamba-1.5-Mini | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (262.144 tokens) - Uitvoer: (4.096 tokens) - Talen: en , fr , es , , pt , , de , en ar he - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
AI21-Jamba-1.5-Large | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (262.144 tokens) - Uitvoer: (4.096 tokens) - Talen: en , fr , es , , pt , , de , en ar he - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Azure OpenAI
Azure OpenAI Service biedt een diverse set modellen met verschillende mogelijkheden en prijspunten. Deze modellen zijn onder andere:
- Geavanceerde modellen die zijn ontworpen om redenerings- en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden
- Modellen die natuurlijke taal en code kunnen begrijpen en genereren
- Modellen die spraak naar tekst kunnen transcriberen en vertalen
Modelleren | Type | Laag | Functies |
---|---|---|---|
o1 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst en afbeelding (200.000 tokens) - Uitvoer: tekst (100.000 tokens) - Talen: , , , , es , de , , id fr , ru , pl , , uk , el , ar ur th bn is cy sw ne tr pa ko zh lv ja , en . mr te af it en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
o1-preview | chatvoltooiing | Algemene standaard Standaard |
-
Invoer: tekst (128.000 tokens) - Uitvoer: (32.768 tokens) - Talen: , , , , es , de , , id fr , ru , pl , , uk , el , ar ur th bn is cy sw ne tr pa ko zh lv ja , en . mr te af it en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
o1-mini | chatvoltooiing | Algemene standaard Standaard |
-
Invoer: tekst (128.000 tokens) - Uitvoer: (65.536 tokens) - Talen: , , , , es , de , , id fr , ru , pl , , uk , el , ar ur th bn is cy sw ne tr pa ko zh lv ja , en . mr te af it en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
gpt-4o-realtime-preview | realtime | Algemene standaard |
-
Invoer: besturingselement, tekst en audio (131.072 tokens) - Uitvoer: tekst en audio (16.384 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
gpt-4o | chatvoltooiing | Algemene standaard Standaard Batch Ingericht Globaal ingericht Gegevenszone |
-
Invoer: tekst en afbeelding (131.072 tokens) - Uitvoer: tekst (16.384 tokens) - Talen: , , , , es , de , , id fr , ru , pl , , uk , el , ar ur th bn is cy sw ne tr pa ko zh lv ja , en . mr te af it en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
gpt-4o-mini | chatvoltooiing | Algemene standaard Standaard Batch Ingericht Globaal ingericht Gegevenszone |
-
Invoer: tekst, afbeelding en audio (131.072 tokens) - Uitvoer: (16.384 tokens) - Talen: , , , , es , de , , id fr , ru , pl , , uk , el , ar ur th bn is cy sw ne tr pa ko zh lv ja , en . mr te af it en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON, gestructureerde uitvoer |
tekst-insluiten-3-groot | insluitingen | Algemene standaard Standaard Ingericht Globaal ingericht |
-
Invoer: tekst (8.191 tokens) - Uitvoer: Vector (3.072 dim.) - Talen: en |
tekst-insluiten-3-klein | insluitingen | Algemene standaard Standaard Ingericht Globaal ingericht |
-
Invoer: tekst (8.191 tokens) - Uitvoer: Vector (1.536 dim.) - Talen: en |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Cohere
De cohere-serie van modellen bevat verschillende modellen die zijn geoptimaliseerd voor verschillende use cases, waaronder voltooiingen van chats en insluitingen. Cohere-modellen zijn geoptimaliseerd voor verschillende gebruiksvoorbeelden, waaronder redenering, samenvatting en antwoord op vragen.
Modelleren | Type | Laag | Functies |
---|---|---|---|
Cohere-embed-v3-english | insluitingen afbeeldingen insluiten |
Algemene standaard |
-
Invoer: tekst (512 tokens) - Uitvoer: Vector (1.024 dim.) - Talen: en |
Cohere-embed-v3-meertalige | insluitingen afbeeldingen insluiten |
Algemene standaard |
-
Invoer: tekst (512 tokens) - Uitvoer: Vector (1.024 dim.) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar |
Cohere-command-r-plus-08-2024 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Cohere-command-r-08-2024 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Cohere-command-r-plus | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Cohere-command-r | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, es, it, de, pt-br, ja, ko, zh-cn en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Core42
Core42 bevat autoregressieve bi-linguïsele LLM's voor Arabisch en Engels met geavanceerde mogelijkheden in het Arabisch.
Modelleren | Type | Laag | Functies |
---|---|---|---|
jais-30b-chat | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (8.192 tokens) - Uitvoer: (4.096 tokens) - Talen: en ar - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Meta
Meta Llama-modellen en -hulpprogramma's zijn een verzameling vooraf getrainde en verfijnde AI-tekst- en afbeeldingsredenmodellen. Het bereik metamodellen is schaal om het volgende op te nemen:
- Kleine taalmodellen (SLM's) zoals 1B en 3B Base en Instruct-modellen voor deductie op het apparaat en de rand
- Middelgrote grote taalmodellen (LLM's) zoals 7B, 8B en 70B Base- en Instruct-modellen
- Krachtige modellen zoals Meta Llama 3.1-405B Instruct for synthetic data generation and distilling use cases.
Modelleren | Type | Laag | Functies |
---|---|---|---|
Llama-3.3-70B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (128.000 tokens) - Uitvoer: tekst (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Llama-3.2-11B-Vision-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst en afbeelding (128.000 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Llama-3.2-90B-Vision-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst en afbeelding (128.000 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Meta-Llama-3.1-405B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Meta-Llama-3-8B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (8.192 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Meta-Llama-3.1-70B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Meta-Llama-3.1-8B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (8.192 tokens) - Talen: en, de, fr, it, pt, hi, es en th - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Meta-Llama-3-70B-Instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (8.192 tokens) - Uitvoer: (8.192 tokens) - Talen: en - Aanroepen van hulpprogramma: Nee* - Antwoordindelingen: Tekst |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Microsoft
Phi is een familie van lichtgewicht, state-of-the-art open modellen. Deze modellen zijn getraind met Phi-3-gegevenssets. De gegevenssets bevatten zowel synthetische gegevens als de gefilterde, openbaar beschikbare websitesgegevens, met een focus op hoogwaardige en redenerende dichte eigenschappen. De modellen hebben een grondig verbeteringsproces ondergaan, waarbij zowel onder supervisie nauwkeurig afstemmen, proximal beleidsoptimalisatie als directe voorkeursoptimalisatie worden opgenomen om nauwkeurige instructies en robuuste veiligheidsmaatregelen te garanderen.
Modelleren | Type | Laag | Functies |
---|---|---|---|
Phi-3-mini-128k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3-mini-4k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (4.096 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3-small-8k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3-medium-128k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3-medium-4k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (4.096 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3.5-vision-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst en afbeelding (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3.5-MoE-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3-small-128k-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-3.5-mini-instruct | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr en uk - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Phi-4 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (16.384 tokens) - Uitvoer: (16.384 tokens) - Talen: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, your, vi, yo, and zh - Tool calling: No - Antwoordindelingen: Tekst |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
Mistral AI
Mistral AI biedt twee categorieën modellen: premium modellen, waaronder Mistral Large en Mistral Small en open modellen, waaronder Mistral Nemo.
Modelleren | Type | Laag | Functies |
---|---|---|---|
Ministral-3B | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Mistral-large | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (32.768 tokens) - Uitvoer: (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Mistral-small | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (32.768 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: fr, de, es, it, en - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Mistral-Nemo | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Mistral-large-2407 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (131.072 tokens) - Uitvoer: (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Mistral-Large-2411 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (128.000 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en, fr, de, es, it, zh, ja, ko, pt, nl en pl - Aanroepen van hulpprogramma' s: Ja - Antwoordindelingen: Tekst, JSON |
Codestral-2501 | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (262.144 tokens) - Uitvoer: tekst (4.096 tokens) - Talen: en - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Bekijk deze modelverzameling in de Azure AI Foundry-portal.
NTT-gegevens
Tsuzumi is een voor autoregressieve taal geoptimaliseerde transformator. De afgestemde versies maken gebruik van SFT (Fine-Tuning onder supervisie). Tsuzumi verwerkt zowel Japans als Engels met hoge efficiëntie.
Modelleren | Type | Laag | Functies |
---|---|---|---|
Tsuzumi-7b | chatvoltooiing | Algemene standaard |
-
Invoer: tekst (8.192 tokens) - Uitvoer: tekst (8.192 tokens) - Talen: en jp - Aanroepen van hulpprogramma' s: Nee - Antwoordindelingen: Tekst |
Volgende stappen
- Ga vandaag aan de slag en implementeer uw eerste model in Azure AI-services