Azure OpenAI Service 모델
Azure OpenAI 서비스는 다양한 기능과 가격대를 갖춘 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역 및 클라우드에 따라 다릅니다. Azure Government 모델 가용성은 Azure Government OpenAI Service를 참조하세요.
모델 | 설명 |
---|---|
o1-preview 및 o1-mini | 제한된 액세스 모델, 특히 향상된 포커스와 기능으로 추론 및 문제 해결 작업을 해결하도록 설계되었습니다. |
GPT-4o 및 GPT-4o mini 및 GPT-4 Turbo | 텍스트와 이미지를 모두 입력으로 허용할 수 있는 다중 모달 버전을 갖춘 가장 유능한 최신 Azure OpenAI 모델입니다. |
GPT-4o-Realtime-Preview | 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원하는 GPT-4o 모델입니다. |
GPT-4 | GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다. |
GPT-3.5 | GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다. |
포함 | 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다. |
DALL-E | 자연어에서 원본 이미지를 생성할 수 있는 일련의 모델입니다. |
위스퍼 | 음성을 텍스트로 기록하고 번역할 수 있는 일련의 미리 보기 모델입니다. |
텍스트 음성 변환(미리 보기) | 텍스트 음성 변환을 합성할 수 있는 일련의 미리 보기 모델입니다. |
o1-preview 및 o1-mini 모델 제한된 액세스
Azure OpenAI o1-preview
및 o1-mini
모델은 포커스 및 기능 향상을 통해 추론 및 문제 해결 작업을 해결하도록 특별히 설계되었습니다. 이러한 모델은 사용자의 요청을 처리하고 이해하는 데 더 많은 시간을 할애하여 이전 반복에 비해 과학, 코딩, 수학과 같은 영역에서 매우 강력한 성능을 보입니다.
Model ID | 설명 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|
o1-preview (2024-09-12) |
향상된 추론 능력을 제공하는 o1 시리즈에서 가장 유능한 모델입니다. | 입력: 128,000 출력: 32,768 |
2023년 10월 |
o1-mini (2024-09-12) |
o1 시리즈의 더 빠르고 비용 효율적인 옵션으로, 속도와 리소스 사용량이 낮은 코딩 작업에 적합합니다. | 입력: 128,000 출력: 65,536 |
2023년 10월 |
가용성
이제 API o1-preview
액세스 및 o1-mini
모델 배포에 모델 및 모델을 사용할 수 있습니다. 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다.
액세스 요청: 모델에 대한 제한된 액세스 신청서
액세스 권한이 부여되면 각 모델에 대한 배포를 만들어야 합니다.
API 지원
o1 시리즈 모델에 대한 지원이 API 버전2024-09-01-preview
에 추가되었습니다.
매개 변수가 max_tokens
더 이상 사용되지 않으며 새 max_completion_tokens
매개 변수로 대체되었습니다. o1 시리즈 모델은 매개 변수에서 max_completion_tokens
만 작동합니다.
사용
이러한 모델은 현재 채팅 완료 API를 사용하는 다른 모델과 동일한 매개 변수 집합을 지원하지 않습니다. 현재 매우 제한된 하위 집합만 지원되므로 , top_p
같은 temperature
일반적인 매개 변수는 사용할 수 없으며 포함하면 요청이 실패합니다. o1-preview
또한 o1-mini
모델은 메시지 배열의 일부로 시스템 메시지 역할을 수락하지 않습니다.
새 max_completion_tokens
매개 변수를 활용하려면 OpenAI Python 라이브러리 버전을 업그레이드해야 할 수 있습니다.
pip install openai --upgrade
인증에 Microsoft Entra ID를 사용하는 경우 Microsoft Entra ID 인증을 사용하여 Azure OpenAI 서비스를 구성하는 방법을 참조하세요.
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
azure_ad_token_provider=token_provider,
api_version="2024-09-01-preview"
)
response = client.chat.completions.create(
model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
messages=[
{"role": "user", "content": "What steps should I think about when writing my first Python API?"},
],
max_completion_tokens = 5000
)
print(response.model_dump_json(indent=2))
사용 가능 지역
승인된 고객을 위해 미국 동부, 미국 동부 2, 미국 중북부, 미국 중남부, 스웨덴 중부, 미국 서부 및 미국 서부 3에서 표준 및 글로벌 표준 배포에 사용할 수 있습니다.
GPT-4o-Realtime-Preview
이 gpt-4o-realtime-preview
모델은 GPT-4o 모델 제품군의 일부이며 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원합니다. GPT-4o 오디오는 실시간 대기 시간이 짧은 대화형 상호 작용을 처리하도록 설계되어 사용자와의 응답성이 높은 지원 에이전트, 도우미, 번역기 및 기타 사용 사례에 적합합니다.
GPT-4o 오디오는 미국 동부 2() 및 스웨덴 중부(eastus2
swedencentral
) 지역에서 사용할 수 있습니다. GPT-4o 오디오 를 사용하려면 지원되는 지역 중 하나에서 기존 리소스를 만들 거나 사용해야 합니다.
리소스를 만들 때 GPT-4o 오디오 모델을 배포할 수 있습니다. 프로그래밍 방식 배포 를 수행하는 경우 모델 이름은 .입니다 gpt-4o-realtime-preview
. GPT-4o 오디오를 사용하는 방법에 대한 자세한 내용은 GPT-4o 오디오 설명서를 참조 하세요.
최대 요청 토큰 및 학습 데이터에 대한 자세한 내용은 다음 표에서 확인할 수 있습니다.
Model ID | 설명 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|
gpt-4o-realtime-preview (2024-10-01-preview) GPT-4o 오디오 |
실시간 오디오 처리를 위한 오디오 모델 | 입력: 128,000 출력: 4,096 |
2023년 10월 |
GPT-4o 및 GPT-4 Turbo
GPT-4o는 텍스트와 이미지를 단일 모델에 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다. GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.
GPT-4o 및 GPT-4o mini 모델에 어떻게 액세스할 수 있나요?
GPT-4o 및 GPT-4o mini는 표준 및 글로벌 표준 모델 배포에 사용할 수 있습니다.
모델을 사용할 수 있는 지원 표준 또는 글로벌 표준 지역에서 기존 리소스를 만들거나 사용해야 합니다.
리소스가 만들어지면 GPT-4o 모델을 배포할 수 있습니다. 프로그래밍 방식으로 배포하는 경우 모델 이름은 다음과 같습니다.
gpt-4o
버전2024-08-06
gpt-4o
, 버전2024-05-13
gpt-4o-mini
버전2024-07-18
GPT-4 Turbo
GPT-4 Turbo는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있는 큰 멀티모달 모델(텍스트 또는 이미지 입력 허용 및 텍스트 생성)입니다. GPT-3.5 Turbo와 마찬가지로 이전 GPT-4 모델 GPT-4 Turbo는 채팅에 최적화되어 있으며 기존 완료 작업에 적합합니다.
GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.
gpt-4
버전:turbo-2024-04-09
이는 다음 미리 보기 모델을 대체합니다.
gpt-4
버전:1106-Preview
gpt-4
버전:0125-Preview
gpt-4
버전:vision-preview
OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점
- OpenAI의 최신
0409
터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다. - Azure OpenAI의 최신
turbo-2024-04-09
버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url
및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.
gpt-4 vision-preview와의 차이점
- GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은
gpt-4
버전:turbo-2024-04-09
에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.
Important
OCR(광학 인식), 개체 그라운딩, 동영상 프롬프트를 포함한 비전 향상 미리 보기 기능은 gpt-4
버전: vision-preview
가 turbo-2024-04-09
로 업그레이드되면 더 이상 사용할 수 없습니다. 현재 이러한 미리 보기 기능 중 하나라도 사용하고 있는 경우, 이 자동 모델 업그레이드는 호환성이 손상되는 변경이 됩니다.
GPT-4 Turbo 프로비전된 관리 가용성
gpt-4
버전:turbo-2024-04-09
은(는) 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.
GPT-4 Turbo with Vision GA 배포
Studio UI에서 GA 모델을 배포하려면 GPT-4
를 선택한 다음 드롭다운 메뉴에서 turbo-2024-04-09
버전을 선택합니다. gpt-4-turbo-2024-04-09
모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.
GPT-4
GPT-4는 GPT-4 Turbo의 선행 버전입니다. GPT-4 및 GPT-4 Turbo 모델 모두 기본 모델 이름은 gpt-4
입니다. 모델 버전을 검사하여 GPT-4와 Turbo 모델을 구분할 수 있습니다.
gpt-4
버전0314
gpt-4
버전0613
gpt-4-32k
버전0613
모델 요약 표에서 각 모델이 지원하는 토큰 컨텍스트 길이를 확인할 수 있습니다.
GPT-4 및 GPT-4 Turbo 모델
- 이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.
모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.
Model ID | 설명 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|
gpt-4o (2024-08-06) GPT-4o(Omni) |
최신 대규모 GA 모델 - 구조적 출력 - 텍스트, 이미지 처리 - JSON 모드 - 병렬 함수 호출 - 정확도와 반응성 향상 - GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티 - 영어 이외의 언어 및 비전 작업에서 뛰어난 성능 |
입력: 128,000 출력: 16,384 |
2023년 10월 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
최신 소규모 GA 모델 - GPT-3.5 Turbo 시리즈 모델을 대체하는 데 이상적인 빠르고 저렴하며 성능이 좋은 모델입니다. - 텍스트, 이미지 처리 - JSON 모드 - 병렬 함수 호출 |
입력: 128,000 출력: 16,384 |
2023년 10월 |
gpt-4o (2024-05-13) GPT-4o(Omni) |
텍스트, 이미지 처리 - JSON 모드 - 병렬 함수 호출 - 정확도와 반응성 향상 - GPT-4 Turbo with Vision과 비교하여 영어 텍스트 및 코딩 작업과의 패리티 - 영어 이외의 언어 및 비전 작업에서 뛰어난 성능 |
입력: 128,000 출력: 4,096 |
2023년 10월 |
gpt-4 (turbo-2024-04-09) 비전 포함 GPT-4 Turbo |
새 GA 모델 - 이전의 모든 GPT-4 미리 보기 모델( vision-preview , 1106-Preview , 0125-Preview )을 바꿉니다. - 기능 제공 여부는 현재 입력 방법 및 배포 유형에 따라 다릅니다. |
입력: 128,000 출력: 4,096 |
2023년 12월 |
gpt-4 (0125-Preview)*GPT-4 Turbo 미리 보기 |
미리 보기 모델 - 1106-Preview 대체 - 코드 생성 성능 향상 - 모델이 작업을 완료하지 않는 경우 감소 - JSON 모드 - 병렬 함수 호출 - 재현 가능한 출력(미리 보기) |
입력: 128,000 출력: 4,096 |
2023년 12월 |
gpt-4 (vision-preview)GPT-4 Turbo with Vision 미리 보기 |
미리 보기 모델 - 텍스트 및 이미지 입력 허용 - 강화 지원 - JSON 모드 - 병렬 함수 호출 - 재현 가능한 출력(미리 보기) |
입력: 128,000 출력: 4,096 |
2023년 4월 |
gpt-4 (1106-미리 보기)GPT-4 Turbo 미리 보기 |
미리 보기 모델 - JSON 모드 - 병렬 함수 호출 - 재현 가능한 출력(미리 보기) |
입력: 128,000 출력: 4,096 |
2023년 4월 |
gpt-4-32k (0613) |
이전 GA 모델 - 도구를 사용하는 기본 함수 호출 |
32,768 | 2021년 9월 |
gpt-4 (0613) |
이전 GA 모델 - 도구를 사용하는 기본 함수 호출 |
8,192 | 2021년 9월 |
gpt-4-32k (0314) |
이전 GA 모델 - 사용 중지 정보 |
32,768 | 2021년 9월 |
gpt-4 (0314) |
이전 GA 모델 - 사용 중지 정보 |
8,192 | 2021년 9월 |
주의
프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적인 최신 GA 버전으로 업그레이드합니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.
- GPT-4 버전 0125-preview는 이전에 버전 1106-preview로 릴리스된 GPT-4 Turbo 미리 보기의 업데이트된 버전입니다.
- GPT-4 버전 0125-preview는 gpt-4-1106-preview에 비해 코드 생성과 같은 작업을 완전히 완료합니다. 이때문에 태스크에 따라 고객은 GPT-4-0125-preview가 gpt-4-1106-preview에 비해 더 많은 출력을 생성한다는 것을 알 수 있습니다. 고객은 새 모델의 출력을 비교하는 것이 좋습니다. GPT-4-0125-preview는 영어가 아닌 언어에 대해 UTF-8 처리를 사용하여 gpt-4-1106-preview의 버그도 해결합니다.
- GPT-4 버전
turbo-2024-04-09
(은)는 최신 GA 릴리스이며0125-Preview
,1106-preview
및vision-preview
(을)를 대체합니다.
Important
GPT-4(gpt-4
) 버전1106-Preview
0125-Preview
이며vision-preview
, 향후 안정적인 버전 gpt-4
으로 업그레이드될 예정입니다.
gpt-4
버전1106-Preview
0125-Preview
배포 및vision-preview
"기본값으로 자동 업데이트" 및 "만료되면 업그레이드"로 설정하면 안정적인 버전이 릴리스된 후 업그레이드가 시작됩니다. 각 배포에 대해 모델 버전 업그레이드는 API 호출에 대한 서비스 중단 없이 발생합니다. 업그레이드는 지역별로 준비되며 전체 업그레이드 프로세스는 2주가 걸릴 것으로 예상됩니다.gpt-4
"자동 업데이트 없음"으로 설정된 버전의1106-Preview
0125-Preview
vision-preview
배포는 업그레이드되지 않으며 지역에서 미리 보기 버전이 업그레이드될 때 작동이 중지됩니다. 업그레이드 시기에 대한 자세한 내용은 Azure OpenAI 모델 사용 중지 및 사용 중단을 참조하세요.
GPT-3.5
GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 유능하고 비용 효율적인 모델은 GPT-3.5 Turbo로, 이는 채팅에 최적화되었으며 기존 완료 작업에도 잘 작동합니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct에는 채팅 완료 API 대신 완료 API를 사용하는 text-davinci-003
과 유사한 기능이 있습니다. 레거시 GPT-3.5 및 GPT-3 모델보다는 GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 사용하는 것이 좋습니다.
Model ID | 설명 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|
gpt-35-turbo (0125) 신규 |
최신 GA 모델 - JSON 모드 - 병렬 함수 호출 - 재현 가능한 출력(미리 보기) - 요청된 형식으로 응답할 때 높아지는 정확도 - 영어 이외의 언어 함수 호출에서 텍스트 인코딩 문제를 발생시킨 버그 수정 |
입력: 16,385 출력: 4,096 |
2021년 9월 |
gpt-35-turbo (1106) |
이전 GA 모델 - JSON 모드 - 병렬 함수 호출 - 재현 가능한 출력(미리 보기) |
입력: 16,385 출력: 4,096 |
2021년 9월 |
gpt-35-turbo-instruct (0914) |
완성 엔드포인트만 - 레거시 완료 모델 대체 |
4,097 | 2021년 9월 |
gpt-35-turbo-16k (0613) |
이전 GA 모델 - 도구를 사용하는 기본 함수 호출 |
16,384 | 2021년 9월 |
gpt-35-turbo (0613) |
이전 GA 모델 - 도구를 사용하는 기본 함수 호출 |
4,096 | 2021년 9월 |
gpt-35-turbo 1(0301) |
이전 GA 모델 - 사용 중지 정보 |
4,096 | 2021년 9월 |
GPT-3.5 Turbo 및 채팅 Completions API와 상호 작용하는 방법에 대해 자세히 알아보려면 자세한 방법을 확인합니다.
1 이 모델은 4,096개의 > 토큰 요청을 수락합니다. 최신 버전의 모델이 4,096개의 토큰으로 제한되므로 4,096개의 입력 토큰 제한을 초과하지 않는 것이 좋습니다. 이 모델에서 4,096개의 입력 토큰을 초과할 때 문제가 발생하는 경우 이 구성은 공식적으로 지원되지 않습니다.
포함
text-embedding-3-large
(은)는 최신의 가장 좋은 기능이 포함된 모델입니다. 포함된 모델 간 업그레이드는 불가능합니다. text-embedding-ada-002
사용에서 text-embedding-3-large
(으)로 이동하려면 새 포함을 생성해야 합니다.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
테스트에서 OpenAI는 MTEB 벤치마크를 사용하여 영어 작업에 대한 성능을 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 임베딩 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.
평가 벤치마크 | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL 평균 | 31.4 | 44.0 | 54.9 |
MTEB 평균 | 61.0 | 62.3 | 64.6 |
3세대 포함 모델은 새 dimensions
매개 변수를 통해 포함 크기를 줄일 수 있습니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. dimensions
매개 변수는 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전인 pip install openai --upgrade
(으)로 업그레이드하는 것이 좋습니다.
OpenAI의 MTEB 벤치마크 테스트에 따르면 3세대 모델의 차원이 text-embeddings-ada-002
1,536차원 미만으로 감소하더라도 성능은 약간 향상됩니다.
DALL-E
DALL-E 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다. DALL-E 3은 일반적으로 REST API와 함께 사용할 수 있습니다. 클라이언트 SDK를 사용하는 DALL-E 2 및 DALL-E 3은 미리 보기로 제공됩니다.
위스퍼
현재 미리 보기 중인 위스퍼 모델은 음성 텍스트 변환에 사용할 수 있습니다.
Azure AI 음성 일괄 처리 대화 기록 API를 통해 Whisper 모델을 사용할 수도 있습니다. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.
텍스트 음성 변환(미리 보기)
현재 미리 보기로 제공되는 OpenAI 텍스트 음성 변환 모델은 텍스트 음성 변환을 합성하는 데 사용할 수 있습니다.
Azure AI Speech를 통해 OpenAI 텍스트 음성 변환 음성을 사용할 수도 있습니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 변환 음성 가이드를 참조하세요.
모델 요약 테이블 및 지역 가용성
배포 유형별 모델
Azure OpenAI는 고객에게 비즈니스 및 사용 패턴에 맞는 호스팅 구조를 선택할 수 있는 기회를 제공합니다. 이 서비스는 다음 두 가지 주요 배포 유형을 제공합니다.
- 표준 은 글로벌 배포 옵션과 함께 제공되며, 트래픽을 전역적으로 라우팅하여 더 높은 처리량을 제공합니다.
- 또한 프로비전은 글로벌 배포 옵션과 함께 제공되므로 고객은 Azure 글로벌 인프라에서 프로비전된 처리량 단위를 구매하고 배포할 수 있습니다.
모든 배포는 정확히 동일한 유추 작업을 수행할 수 있지만 청구, 규모 및 성능은 크게 다릅니다. Azure OpenAI 배포 유형에 대한 자세한 내용은 배포 유형 가이드를 참조하세요.
글로벌 표준 모델 가용성
지역 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4o-realtime-preview, 2024-10-01 | gpt-4, turbo-2024-04-09 |
---|---|---|---|---|---|---|---|
australiaeast | - | - | ✅ | - | ✅ | - | ✅ |
brazilsouth | - | - | ✅ | - | ✅ | - | ✅ |
canadaeast | - | - | ✅ | - | ✅ | - | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | ✅ | - | ✅ | - | ✅ |
germanywestcentral | - | - | ✅ | - | ✅ | - | ✅ |
japaneast | - | - | ✅ | - | ✅ | - | ✅ |
koreacentral | - | - | ✅ | - | ✅ | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
norwayeast | - | - | ✅ | - | ✅ | - | ✅ |
polandcentral | - | - | ✅ | - | ✅ | - | ✅ |
southafricanorth | - | - | ✅ | - | ✅ | - | ✅ |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
southindia | - | - | ✅ | - | ✅ | - | ✅ |
스페인 중부 | - | - | ✅ | ✅ | ✅ | - | ✅ |
스웨덴 중부 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
스위스 북부 | - | - | ✅ | - | ✅ | - | ✅ |
uaenorth | - | - | ✅ | - | ✅ | - | ✅ |
uksouth | - | - | ✅ | - | ✅ | - | ✅ |
westeurope | - | - | ✅ | - | ✅ | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
이 표에는 지역별 가용성 정보 미세 조정이 포함되어 있지 않습니다. 이 정보는 미세 조정 섹션을 참조하세요.
엔드포인트별 표준 모델
채팅 완료
지역 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-미리 보기 | gpt-4, 0125-미리 보기 | gpt-4, vision-미리 보기 | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ |
canadaeast | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
norwayeast | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - |
southindia | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - |
스웨덴 중부 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
스위스 북부 | - | - | - | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ |
uksouth | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | ✅ | - |
GPT-4 및 GPT-4 Turbo 모델 가용성
고객 액세스 선택
모든 Azure OpenAI 고객이 사용할 수 있는 위의 지역 외에도 일부 기존 고객은 추가 지역에서 GPT-4 버전에 대한 액세스 권한을 부여했습니다.
모델 | 지역 |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
미국 동부 프랑스 중부 미국 중남부 영국 남부 |
gpt-4 (0613) gpt-4-32k (0613) |
미국 동부 미국 동부 2 일본 동부 영국 남부 |
GPT-3.5 모델
모델 버전을 참조하여 Azure OpenAI Service가 모델 버전 업그레이드를 처리하는 방법을 참조하고 모델 작업을 참조하여 GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아봅니다.
모델 미세 조정
참고 항목
gpt-35-turbo
- 이 모델의 미세 조정은 하위 지역 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서는 사용할 수 없습니다.
AI Studio 프로젝트에서 Azure OpenAI 모델을 사용하는 경우 프로젝트 외부에 비해 미세 조정에 지원되는 지역이 달라질 수 있습니다.
Model ID | 미세 조정 지역 | 최대 요청(토큰) | 학습 데이터(최대) |
---|---|---|---|
babbage-002 |
미국 중북부 스웨덴 중부 스위스 서부 |
16,384 | 2021년 9월 |
davinci-002 |
미국 중북부 스웨덴 중부 스위스 서부 |
16,384 | 2021년 9월 |
gpt-35-turbo (0613) |
미국 동부2 미국 중북부 스웨덴 중부 스위스 서부 |
4,096 | 2021년 9월 |
gpt-35-turbo (1106) |
미국 동부2 미국 중북부 스웨덴 중부 스위스 서부 |
입력: 16,385 출력: 4,096 |
2021년 9월 |
gpt-35-turbo (0125) |
미국 동부2 미국 중북부 스웨덴 중부 스위스 서부 |
16,385 | 2021년 9월 |
gpt-4 (0613) 1 |
미국 중북부 스웨덴 중부 |
8192 | 2021년 9월 |
gpt-4o-mini (2024-07-18) |
미국 중북부 스웨덴 중부 |
입력: 128,000 출력: 16,384 학습 예제 컨텍스트 길이: 64,536 |
2023년 10월 |
gpt-4o (2024-08-06) |
미국 동부2 미국 중북부 스웨덴 중부 |
입력: 128,000 출력: 16,384 학습 예제 컨텍스트 길이: 64,536 |
2023년 10월 |
1 GPT-4는 현재 공개 미리 보기로 제공됩니다.
도우미(미리 보기)
도우미의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 다음 모델은 Assistants API, SDK 및 Azure AI Studio에서 사용할 수 있습니다. 다음 표는 종량제에 대한 것입니다. 프로비전된 처리량 단위(PTU) 가용성에 대한 자세한 내용은 프로비전된 처리량을 참조하세요. 나열된 모델과 지역은 Assistants v1과 v2 모두에서 사용할 수 있습니다. 아래 나열된 지역에서 지원되는 경우 글로벌 표준 모델을 사용할 수 있습니다.
지역 | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
오스트레일리아 동부 | ✅ | ✅ | ✅ | ✅ | ||||
미국 동부 | ✅ | ✅ | ✅ | ✅ | ||||
미국 동부 2 | ✅ | ✅ | ✅ | ✅ | ✅ | |||
프랑스 중부 | ✅ | ✅ | ✅ | ✅ | ||||
일본 동부 | ✅ | |||||||
노르웨이 동부 | ✅ | |||||||
스웨덴 중부 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
영국 남부 | ✅ | ✅ | ✅ | ✅ | ||||
미국 서부 | ✅ | ✅ | ✅ | |||||
미국 서부 3 | ✅ | ✅ |
모델 사용 중지
모델 사용 중지에 대한 최신 정보는 모델 사용 중지 가이드를 참조하세요.