Azure AI 모델 유추에서 사용할 수 있는 모델

아티클
01/30/2025

Azure AI Foundry의 Azure AI 모델 유추를 통해 Azure AI의 주력 모델에 액세스하여 인프라에서 호스트하지 않고 API로 사용할 수 있습니다.

팁

DeepSeek-R1(미리 보기)은 서버리스 API 엔드포인트로 배포할 수 있습니다.

모델 가용성은 모델 공급자, 배포 SKU 및 클라우드에 따라 다릅니다. Azure AI 모델 유추에서 사용할 수 있는 모든 모델은 글로벌 용량을 사용하여 처리량을 보장하는 글로벌 표준 배포 유형을 지원합니다. Azure OpenAI 모델은 지역 배포 및 소버린 클라우드(Azure Government, Azure 독일 및 Azure 중국 21Vianet)도 지원합니다.

Azure OpenAI 모델 가용성에서 Azure OpenAI에 대한 특정 배포 기능에 대해 자세히 알아봅니다.

팁

Azure AI 모델 카탈로그는 더 큰 범위의 공급자에서 더 많은 모델을 제공합니다. 그러나 이러한 모델을 사용하려면 AI 허브 및 프로젝트 만들기를 포함하여 인프라에서 호스트해야 할 수 있습니다. Azure AI 모델 서비스는 종량제 청구를 통해 인프라에서 모델을 호스팅하지 않고 모델을 API로 사용하는 방법을 제공합니다. Azure AI 모델 카탈로그에 대해 자세히 알아봅니다.

Azure AI Foundry 포털의 모델 카탈로그에서 사용 가능한 모든 모델을 볼 수 있습니다.

AI21 Labs

Jamba 제품군 모델은 AI21의 하이브리드 Mamba-Transformer 아키텍처를 사용하는 AI21의 프로덕션 등급 Mamba 기반 LLM(대규모 언어 모델)입니다. AI21의 하이브리드 SSM(구조화 상태 공간 모델) 변환기 Jamba 모델의 명령 조정 버전입니다. Jamba 제품군 모델은 품질 및 성능과 관련하여 안정적인 상업적 사용을 위해 제작되었습니다.

모델	Type	계층	기능
AI21-Jamba-1.5-Mini	채팅 완료	글로벌 표준	- 입력: 텍스트(262,144개 토큰) - 출력: (4,096개의 토큰) - 언어: ,, `fres`, `ptde`, `ar`및 `enhe` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
AI21-Jamba-1.5-Large	채팅 완료	글로벌 표준	- 입력: 텍스트(262,144개 토큰) - 출력: (4,096개의 토큰) - 언어: ,, `fres`, `ptde`, `ar`및 `enhe` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Azure OpenAI

Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합을 제공합니다. 해당 모델은 다음과 같습니다.

포커스 및 기능 향상을 통해 추론 및 문제 해결 작업을 해결하도록 설계된 최신 모델
자연어 및 코드를 이해하고 생성할 수 있는 모델
음성을 텍스트로 전사하고 번역할 수 있는 모델

모델	Type	계층	기능
o1	채팅 완료	글로벌 표준	- 입력: 텍스트 및 이미지(토큰 200,000개) - 출력: 텍스트(토큰 100,000개) - 언어: , ,`it`, `af`, `es`, `de`, `fr`, `id`, `ru`, `pl`, `uk`, `ellv`, `zh`, `ar`, `tr`, `swja`, , `kocy`, `is`, `bn`, `ur`, `ne`, `th`, `pa`, `mr`및 `te`.`en` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
o1-preview	채팅 완료	전역 표준 Standard	- 입력: 텍스트(128,000개의 토큰) - 출력: (32,768개의 토큰) - 언어: , ,`it`, `af`, `es`, `de`, `fr`, `id`, `ru`, `pl`, `uk`, `ellv`, `zh`, `ar`, `tr`, `swja`, , `kocy`, `is`, `bn`, `ur`, `ne`, `th`, `pa`, `mr`및 `te`.`en` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
o1-mini	채팅 완료	전역 표준 Standard	- 입력: 텍스트(128,000개의 토큰) - 출력: (65,536개의 토큰) - 언어: , ,`it`, `af`, `es`, `de`, `fr`, `id`, `ru`, `pl`, `uk`, `ellv`, `zh`, `ar`, `tr`, `swja`, , `kocy`, `is`, `bn`, `ur`, `ne`, `th`, `pa`, `mr`및 `te`.`en` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
gpt-4o-realtime-preview	실시간	글로벌 표준	- 입력: 컨트롤, 텍스트 및 오디오(토큰 131,072개) - 출력: 텍스트 및 오디오(16,384개 토큰) - 언어: en - 도구 호출: 예 - 응답 형식: 텍스트, JSON
gpt-4o	채팅 완료	전역 표준 Standard Batch 프로비전됨 전역 프로비전 데이터 영역	- 입력: 텍스트 및 이미지(토큰 131,072개) - 출력: 텍스트(16,384개 토큰) - 언어: , ,`it`, `af`, `es`, `de`, `fr`, `id`, `ru`, `pl`, `uk`, `ellv`, `zh`, `ar`, `tr`, `swja`, , `kocy`, `is`, `bn`, `ur`, `ne`, `th`, `pa`, `mr`및 `te`.`en` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
gpt-4o-mini	채팅 완료	전역 표준 Standard Batch 프로비전됨 전역 프로비전 데이터 영역	- 입력: 텍스트, 이미지 및 오디오(토큰 131,072개) - 출력: (16,384개의 토큰) - 언어: , ,`it`, `af`, `es`, `de`, `fr`, `id`, `ru`, `pl`, `uk`, `ellv`, `zh`, `ar`, `tr`, `swja`, , `kocy`, `is`, `bn`, `ur`, `ne`, `th`, `pa`, `mr`및 `te`.`en` - 도구 호출: 예 - 응답 형식: 텍스트, JSON, 구조적 출력
text-embedding-3-large	embeddings	전역 표준 Standard 프로비전됨 전역 프로비전	- 입력: 텍스트(8,191개 토큰) - 출력: 벡터(3,072 dim.) - 언어들:`en`
text-embedding-3-small	embeddings	전역 표준 Standard 프로비전됨 전역 프로비전	- 입력: 텍스트(8,191개 토큰) - 출력: 벡터(1,536 dim.) - 언어들:`en`

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Cohere

Cohere 모델 제품군에는 채팅 완료 및 포함을 포함하여 다양한 사용 사례에 최적화된 다양한 모델이 포함되어 있습니다. Cohere 모델은 추론, 요약 및 질문 답변을 포함하는 다양한 사용 사례에 최적화되어 있습니다.

모델	Type	계층	기능
Cohere-embed-v3-english	embeddings image-embeddings	글로벌 표준	- 입력: 텍스트(512개 토큰) - 출력: 벡터(1,024 dim.) - 언어: en
Cohere-embed-v3-multilingual	embeddings image-embeddings	글로벌 표준	- 입력: 텍스트(512개 토큰) - 출력: 벡터(1,024 dim.) - 언어: en, fr, es, it, de, pt-br, ja, ko, zh-cn 및 ar
Cohere-command-r-plus-08-2024	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, fr, es, it, de, pt-br, ja, ko, zh-cn 및 ar - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Cohere-command-r-08-2024	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, fr, es, it, de, pt-br, ja, ko, zh-cn 및 ar - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Cohere-command-r-plus	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, fr, es, it, de, pt-br, ja, ko, zh-cn 및 ar - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Cohere-command-r	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, fr, es, it, de, pt-br, ja, ko, zh-cn 및 ar - 도구 호출: 예 - 응답 형식: 텍스트, JSON

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Core42

Core42에는 아랍어 및 영어용 자동 회귀 이중 언어 LLM과 아랍어로 된 최신 기능이 포함되어 있습니다.

모델	Type	계층	기능
jais-30b-chat	채팅 완료	글로벌 표준	- 입력: 텍스트(8,192개 토큰) - 출력: (4,096개의 토큰) - 언어: en 및 ar - 도구 호출: 예 - 응답 형식: 텍스트, JSON

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

메타

Meta Llama 모델 및 도구는 미리 학습되고 미세 조정된 생성 AI 텍스트 및 이미지 추론 모델의 컬렉션입니다. 메타 모델 범위는 다음을 포함하도록 크기 조정됩니다.

1B 및 3B 기본과 같은 작은 언어 모델(SLLM) 및 디바이스 및 에지 추론에 대한 지시 모델
7B, 8B 및 70B 기본 및 지시 모델과 같은 중형 LLM(대규모 언어 모델)
메타 라마 3.1-405B와 같은 고성능 모델은 합성 데이터 생성 및 증류 사용 사례에 대한 지침을 제공합니다.

모델	Type	계층	기능
Llama-3.3-70B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(128,000개의 토큰) - 출력: 텍스트(8,192개 토큰) - 언어: en, de, fr, it, pt, hi, es 및 th - 도구 호출: 아니요* - 응답 형식: 텍스트
Llama-3.2-11B-Vision-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트 및 이미지(128,000개의 토큰) - 출력: (8,192개의 토큰) - 언어: en - 도구 호출: 아니요* - 응답 형식: 텍스트
Llama-3.2-90B-Vision-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트 및 이미지(128,000개의 토큰) - 출력: (8,192개의 토큰) - 언어: en - 도구 호출: 아니요* - 응답 형식: 텍스트
Meta-Llama-3.1-405B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (8,192개의 토큰) - 언어: en, de, fr, it, pt, hi, es 및 th - 도구 호출: 아니요* - 응답 형식: 텍스트
Meta-Llama-3-8B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(8,192개 토큰) - 출력: (8,192개의 토큰) - 언어: en - 도구 호출: 아니요* - 응답 형식: 텍스트
Meta-Llama-3.1-70B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (8,192개의 토큰) - 언어: en, de, fr, it, pt, hi, es 및 th - 도구 호출: 아니요* - 응답 형식: 텍스트
Meta-Llama-3.1-8B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (8,192개의 토큰) - 언어: en, de, fr, it, pt, hi, es 및 th - 도구 호출: 아니요* - 응답 형식: 텍스트
Meta-Llama-3-70B-Instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(8,192개 토큰) - 출력: (8,192개의 토큰) - 언어: en - 도구 호출: 아니요* - 응답 형식: 텍스트

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Microsoft

Phi는 경량의 최첨단 오픈 모델 제품군입니다. 이러한 모델은 Phi-3 데이터 세트를 사용하여 학습되었습니다. 데이터 세트에는 고품질 및 추론 밀도가 높은 속성에 중점을 둔 가상 데이터와 필터링된 공개적으로 사용 가능한 웹 사이트 데이터가 모두 포함됩니다. 이 모델은 엄격한 개선 프로세스를 거쳤으며, 감독된 미세 조정, 근시 정책 최적화, 직접 기본 설정 최적화를 모두 통합하여 정확한 명령 준수와 강력한 안전 조치를 보장합니다.

모델	Type	계층	기능
Phi-3-mini-128k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3-mini-4k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(4,096개 토큰) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3-small-8k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3-medium-128k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3-medium-4k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(4,096개 토큰) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3.5-vision-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트 및 이미지(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3.5-MoE-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: 텍스트(4,096개 토큰) - 언어: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr 및 uk - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3-small-128k-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트
Phi-3.5-mini-instruct	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, ar, zh, cs, da, nl, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, tr 및 uk - 도구 호출: 아니요 - 응답 형식: 텍스트
피-4	채팅 완료	글로벌 표준	- 입력: 텍스트(16,384개 토큰) - 출력: (16,384개의 토큰) - 언어: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, your, vi, yo, and zh - tool calling: No: No - 응답 형식: 텍스트

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Mistral AI

Mistral AI는 Mistral Large 및 Mistral Small 및 Mistral Nemo를 비롯한 개방형 모델을 포함한 프리미엄 모델이라는 두 가지 범주의 모델을 제공합니다.

모델	Type	계층	기능
Ministral-3B	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: 텍스트(4,096개 토큰) - 언어: fr, de, es, it 및 en - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Mistral-large	채팅 완료	글로벌 표준	- 입력: 텍스트(32,768개 토큰) - 출력: (4,096개의 토큰) - 언어: fr, de, es, it 및 en - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Mistral-small	채팅 완료	글로벌 표준	- 입력: 텍스트(32,768개 토큰) - 출력: 텍스트(4,096개 토큰) - 언어: fr, de, es, it 및 en - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Mistral-Nemo	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: 텍스트(4,096개 토큰) - 언어: en, fr, de, es, it, zh, ja, ko, pt, nl 및 pl - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Mistral-large-2407	채팅 완료	글로벌 표준	- 입력: 텍스트(토큰 131,072개) - 출력: (4,096개의 토큰) - 언어: en, fr, de, es, it, zh, ja, ko, pt, nl 및 pl - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Mistral-Large-2411	채팅 완료	글로벌 표준	- 입력: 텍스트(128,000개의 토큰) - 출력: 텍스트(4,096개 토큰) - 언어: en, fr, de, es, it, zh, ja, ko, pt, nl 및 pl - 도구 호출: 예 - 응답 형식: 텍스트, JSON
Codestral-2501	채팅 완료	글로벌 표준	- 입력: 텍스트(262,144개 토큰) - 출력: 텍스트(4,096개 토큰) - 언어: en - 도구 호출: 아니요 - 응답 형식: 텍스트

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

NTT Data

츠즈미 는 자동 회귀 언어 최적화 변환기입니다. 조정된 버전은 감독된 SFT(미세 조정)를 사용합니다. 쓰즈미는 고효율로 일본어와 영어를 모두 처리합니다.

모델	Type	계층	기능
쓰즈미-7b	채팅 완료	글로벌 표준	- 입력: 텍스트(8,192개 토큰) - 출력: 텍스트(8,192개 토큰) - 언어: en 및 jp - 도구 호출: 아니요 - 응답 형식: 텍스트

다음 단계

오늘 시작 및 Azure AI 서비스에 주먹 모델 배포