Azure OpenAI 서비스의 새로운 기능

아티클
01/17/2025

이 문서에서는 Azure OpenAI에 대한 최신 릴리스 및 주요 설명서 업데이트에 대한 요약을 제공합니다.

2025년 1월

GPT-4o 실시간 API 2024-12-17

gpt-4o-realtime-preview 모델 버전 2024-12-17은 미국 동부 2 및 스웨덴 중부 지역의 글로벌 배포에 사용할 수 있습니다. 실시간 오디오 상호 작용을 gpt-4o-realtime-preview 위해 버전 2024-10-01-preview 모델 대신 gpt-4o-realtime-preview 버전 2024-12-17 모델을 사용합니다.

모델을 사용한 프롬프트 캐싱에 대한 지원이 추가되었습니다gpt-4o-realtime-preview.
새 음성에 대한 지원이 추가되었습니다. gpt-4o-realtime-preview 이제 모델은 "alloy", "ash", "ballad", "coral", "echo", "sage", "shimmer", "verse"라는 음성을 지원합니다.
속도 제한은 더 이상 분당 연결을 기반으로 하지 않습니다. 속도 제한은 이제 모델의 RPM(분당 요청) 및 TPM(분당 토큰) gpt-4o-realtime-preview 을 기반으로 합니다. 각 gpt-4o-realtime-preview 모델 배포에 대한 속도 제한은 100K TPM 및 1K RPM입니다. 미리 보기 중에 Azure AI Foundry 포털 및 API는 다른 속도 제한을 부정확하게 표시할 수 있습니다. 다른 속도 제한을 설정하려고 해도 실제 속도 제한은 100K TPM 및 1K RPM이 됩니다.

자세한 내용은 GPT-4o 실시간 오디오 빠른 시작 및 방법 가이드 를 참조하세요.

2024년 12월

제한된 액세스를 위해 릴리스된 o1 추론 모델

이제 최신 o1 모델을 API 액세스 및 모델 배포에 사용할 수 있습니다. 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다. 이전에 액세스 권한을 o1-preview적용하고 받은 고객은 최신 모델의 대기 목록에 자동으로 있으므로 다시 적용할 필요가 없습니다.

액세스 요청: 모델에 대한 제한된 액세스 신청서

고급 o1 시리즈 모델에 대한 자세한 내용은 o1 시리즈 추론 모델을 시작하세요.

사용 가능 지역

모델	지역
`o1` (버전: 2024-12-17)	미국 동부 2(글로벌 표준) 스웨덴 중부(글로벌 표준)

기본 설정 미세 조정(미리 보기)

DPO(직접 기본 설정 최적화) 는 큰 언어 모델에 대한 새로운 맞춤 기술로, 사람의 기본 설정에 따라 모델 가중치를 조정하도록 설계되었습니다. RLHF(사용자 피드백)의 보충 학습과 달리 DPO는 보상 모델을 맞추지 않아도 되며 학습에 더 간단한 데이터(이진 기본 설정)를 사용합니다. 이 메서드는 계산이 더 가볍고 빠르므로 보다 효율적이면서 맞춤에 균등하게 효과적입니다. DPO는 톤, 스타일 또는 특정 콘텐츠 기본 설정과 같은 주관적인 요소가 중요한 시나리오에서 특히 유용합니다. 모델부터 gpt-4o-2024-08-06 시작하여 Azure OpenAI Service에서 DPO의 공개 미리 보기를 발표하게 되어 기쁩니다.

모델 영역 가용성을 미세 조정하려면 모델 페이지를 참조 하세요.

저장된 완성 및 증류

저장된 완료를 사용하면 채팅 완료 세션에서 평가 및 미세 조정을 위한 데이터 세트로 사용할 대화 기록을 캡처할 수 있습니다.

GPT-4o 2024-11-20

gpt-4o-2024-11-20는 이제 다음의 글로벌 표준 배포에 사용할 수 있습니다.

미국 동부
미국 동부 2
미국 중북부
미국 중남부
미국 서부
미국 서부 3
스웨덴 중부

NEW 데이터 영역 프로비전된 배포 유형

데이터 영역 프로비전된 배포는 다른 모든 Azure OpenAI 배포 유형과 동일한 Azure OpenAI 리소스에서 사용할 수 있지만, Azure 글로벌 인프라를 활용하여 각 요청에 가장 적합한 가용성으로 Microsoft 정의 데이터 영역 내의 데이터 센터로 트래픽을 동적으로 라우팅할 수 있습니다. 데이터 영역 프로비전된 배포는 Microsoft에서 지정한 데이터 영역 내에서 Azure 인프라를 사용하여 높고 예측 가능한 처리량을 위한 예약된 모델 처리 용량을 제공합니다. 프로비전된 데이터 영역 배포는 모델 gpt-4o-2024-05-13및 gpt-4o-mini-2024-07-18 모델에서 gpt-4o-2024-08-06지원됩니다.

자세한 내용은 배포 유형 가이드를 참조하세요.

2024년 11월

비전 미세 조정 GA

현재 GA(일반 공급)에서 GPT-4o(2024-08-06)를 사용한 비전 미세 조정

비전 미세 조정을 사용하면 JSONL 학습 데이터에 이미지를 추가할 수 있습니다. 하나 이상의 이미지 입력을 채팅 완료에 보낼 수 있는 것처럼 학습 데이터 내에 동일한 메시지 유형을 포함할 수 있습니다. 이미지는 URL 또는 base64로 인코딩된 이미지로 제공할 수 있습니다.

모델 영역 가용성을 미세 조정하려면 모델 페이지를 참조 하세요.

새로운 AI 남용 모니터링

MICROSOFT는 LLM을 활용하여 Azure OpenAI 서비스의 잠재적으로 악의적인 사용을 탐지하는 효율성을 개선하고 프롬프트 및 완료에 대한 사용자 검토 없이도 남용 모니터링을 가능하게 하는 새로운 형태의 남용 모니터링을 도입하고 있습니다. 자세한 내용은 남용 모니터링을 참조 하세요.

콘텐츠 분류를 통해 플래그가 지정되거나 잠재적으로 악의적인 사용 패턴의 일부로 식별되는 프롬프트 및 완료에는 시스템의 분석을 확인하고 조치 결정을 알리는 데 도움이 되는 추가 검토 프로세스가 적용됩니다. 남용 모니터링 시스템은 기본적으로 LLM 및 필요한 경우 인간에 의해 검토될 수 있도록 확장되었습니다.

2024년 10월

NEW 데이터 영역 표준 배포 유형

데이터 영역 표준 배포는 다른 모든 Azure OpenAI 배포 유형과 동일한 Azure OpenAI 리소스에서 사용할 수 있지만, Azure 글로벌 인프라를 활용하여 각 요청에 가장 적합한 가용성으로 Microsoft 정의 데이터 영역 내의 데이터 센터로 트래픽을 동적으로 라우팅할 수 있습니다. 데이터 영역 표준은 Azure 지리 기반 배포 유형보다 더 높은 기본 할당량을 제공합니다. 데이터 영역 표준 배포는 및 gpt-4o-2024-05-13gpt-4o-mini-2024-07-18 모델에서 gpt-4o-2024-08-06지원됩니다.

자세한 내용은 배포 유형 가이드를 참조하세요.

전역 Batch GA

이제 Azure OpenAI 글로벌 일괄 처리가 일반 공급됩니다.

Azure OpenAI 일괄 처리 API는 대규모 및 대용량 처리 작업을 효율적으로 처리하도록 설계되었습니다. 별도의 할당량으로 비동기 요청 그룹을 처리하고 24시간 대상 처리 시간을 제공하며, 글로벌 표준보다 50% 더 저렴한 비용을 제공합니다. 일괄 처리를 사용하면 한 번에 하나의 요청을 보내는 것이 아니라, 단일 파일에 많은 수의 요청을 보냅니다. 글로벌 일괄 처리 요청에는 별도의 큐 토큰 할당량이 있어 온라인 워크로드가 중단되지 않습니다.

주요 사용 사례는 다음과 같습니다.

대규모 데이터 처리: 방대한 데이터 세트를 병렬로 빠르게 분석합니다.
콘텐츠 생성: 제품 설명이나 문서 등 방대한 양의 텍스트를 만듭니다.
문서 검토 및 요약: 긴 문서의 검토 및 요약을 자동화합니다.
고객 지원 자동화: 더 빠른 응답을 위해 여러 문의를 동시에 처리합니다.
데이터 추출 및 분석: 방대한 양의 구조화되지 않은 데이터에서 정보를 추출하고 분석합니다.
NLP(자연어 처리) 작업: 대규모 데이터 세트에 대한 감정 분석이나 번역과 같은 작업을 수행합니다.
마케팅 및 개인 설정: 대규모로 개인 설정 콘텐츠와 권장 사항을 생성합니다.

글로벌 일괄 처리 배포 시작에 대한 자세한 내용은 다음을 참조합니다.

o1-preview 및 o1-mini 모델 제한된 액세스

이제 API o1-preview 액세스 및 o1-mini 모델 배포에 모델 및 모델을 사용할 수 있습니다. 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다.

액세스 요청: 모델에 대한 제한된 액세스 신청서

이미 승인되었고 초기 액세스 플레이그라운드를 통해 모델에 액세스할 수 있는 고객은 다시 적용할 필요가 없으며 API 액세스 권한이 자동으로 부여됩니다. 액세스 권한이 부여되면 각 모델에 대한 배포를 만들어야 합니다.

API 지원:

o1 시리즈 모델에 대한 지원이 API 버전2024-09-01-preview에 추가되었습니다.

매개 변수가 max_tokens 더 이상 사용되지 않으며 새 max_completion_tokens 매개 변수로 대체되었습니다. o1 시리즈 모델은 매개 변수에서 max_completion_tokens 만 작동합니다.

지역 가용성:

모델은 승인된 고객을 위해 미국 동부 2 및 스웨덴 중부의 표준 및 글로벌 표준 배포에 사용할 수 있습니다.

음성 및 오디오 공개 미리 보기를 위한 새로운 GPT-4o 실시간 API

Azure OpenAI GPT-4o 오디오는 짧은 대기 시간, "음성 출력, 음성 출력" 대화형 상호 작용을 지원하는 GPT-4o 모델 제품군의 일부입니다. GPT-4o 오디오 realtime API는 실시간 대기 시간이 짧은 대화형 상호 작용을 처리하도록 설계되어 사용자와 모델 간의 실시간 상호 작용(예: 고객 지원 에이전트, 음성 도우미 및 실시간 번역기)과 관련된 사용 사례에 적합합니다.

이 gpt-4o-realtime-preview 모델은 미국 동부 2 및 스웨덴 중부 지역의 글로벌 배포에 사용할 수 있습니다.

자세한 내용은 GPT-4o 실시간 오디오 빠른 시작을 참조하세요.

전역 일괄 처리 지원 업데이트

전역 일괄 처리는 이제 GPT-4o(2024-08-06)를 지원합니다. 자세한 내용은 전역 일괄 처리 시작 가이드를 참조하세요.

2024년 9월

Azure OpenAI Studio UX 업데이트

2024년 9월 19일부터 Azure OpenAI Studio로 이동하면 기본적으로 레거시 Azure OpenAI Studio가 더 이상 표시되지 않습니다. 필요한 경우 향후 몇 주 동안 UI 상단 표시줄에 있는 이전 디자인으로 전환 토글을 사용하여 이전 환경으로 돌아갈 수 있습니다. 레거시 Azure AI Foundry 포털로 다시 전환하는 경우 피드백 양식을 작성하여 이유를 알려주는 데 도움이 됩니다. 이러한 피드백을 적극적으로 모니터링하여 새로운 환경을 개선하고 있습니다.

GPT-4o 2024-08-06 프로비전된 배포

GPT-4o 2024-08-06은 현재 미국 동부, 미국 동부 2, 미국 중북부, 스웨덴 중부 지역에서 프로비전된 배포로 제공됩니다. 전역 프로비전된 배포에도 사용할 수 있습니다.

모델 가용성에 대한 최신 정보는 모델 페이지를 참조하세요.

새로운 전역 프로비전된 배포 유형

글로벌 배포는 글로벌이 아닌 배포 유형과 동일한 Azure OpenAI 리소스에서 사용할 수 있지만 Azure의 글로벌 인프라를 활용하여 각 요청에 대해 최상의 가용성을 제공하면서 트래픽을 데이터 센터로 동적으로 라우팅할 수 있습니다. 전역 프로비전된 배포는 Azure 글로벌 인프라를 사용하여 예측 가능한 높은 처리량을 위한 예약된 모델 처리 용량을 제공합니다. 전역 프로비전된 배포는 gpt-4o-2024-08-06 및 gpt-4o-mini-2024-07-18 모델에서 지원됩니다.

자세한 내용은 배포 유형 가이드를 참조하세요.

제한적 액세스가 가능한 새로운 o1-preview 및 o1-mini 모델

Azure OpenAI o1-preview 및 o1-mini 모델은 포커스 및 기능 향상을 통해 추론 및 문제 해결 작업을 처리하도록 설계되었습니다. 이러한 모델은 사용자의 요청을 처리하고 이해하는 데 더 많은 시간을 할애하여 이전 반복에 비해 과학, 코딩, 수학과 같은 영역에서 매우 강력한 성능을 보입니다.

o1 시리즈의 주요 기능

복잡한 코드 생성: 개발자를 지원하기 위해 알고리즘을 생성하고 고급 코딩 작업을 처리할 수 있습니다.
고급 문제 해결: 포괄적인 브레인스토밍 세션 및 다각적인 문제 해결에 이상적입니다.
복잡한 문서 비교: 계약, 사례 파일 또는 법적 문서를 분석하여 미묘한 차이를 식별하는 데 적합합니다.
지침 따르기 및 워크플로 관리: 더 짧은 컨텍스트가 필요한 워크플로를 관리하는 데 특히 효과적입니다.

모델 유형

o1-preview: o1-preview는 o1 시리즈 모델 중 더욱 뛰어난 기능을 제공합니다.
o1-mini: o1-mini는 o1 시리즈 모델 중 가장 빠르고 저렴합니다.

모델 버전: 2024-09-12

액세스 요청: 모델에 대한 제한된 액세스 신청서

제한 사항

o1 시리즈 모델은 현재 미리 보기 상태이며 최신 GPT-4o 모델에서 사용할 수 있는 이미지 이해 및 구조화된 출력과 같은 다른 모델에서 사용할 수 있는 일부 기능을 포함하지 않습니다. 많은 작업의 경우 일반적으로 사용할 수 있는 GPT-4o 모델이 여전히 더 적합할 수 있습니다.

안전

OpenAI는 모델이 안전하지 않은 요청을 거부하는 데 도움이 되는 새로운 기술을 비롯하여 추가적인 안전 조치를 o1 모델에 도입했습니다. 이러한 발전으로 인해 o1 시리즈는 제공되는 모델 중 가장 강력한 모델로 자리 잡았습니다.

가용성

o1-preview o1-mini Azure AI Foundry 포털 초기 액세스 플레이그라운드를 통해 제한된 액세스를 위해 미국 동부 2 지역에서 사용할 수 있습니다. 모델에 대한 데이터 처리는 o1 사용할 수 있는 지역과 다른 지역에서 발생할 수 있습니다.

조기 액세스 플레이그라운드에서 o1-preview 및 o1-mini 모델을 사용해 보려면 등록이 필요하며 Microsoft의 자격 기준에 따라 액세스 권한이 부여됩니다.

액세스 요청: 모델에 대한 제한된 액세스 신청서

액세스 권한이 부여되면 다음을 수행해야 합니다.

https://ai.azure.com/resources로 이동하여 eastus2 지역에서 리소스를 선택합니다. 이 지역에 Azure OpenAI 리소스가 없는 경우 리소스를 만들어야 합니다.
eastus2 Azure OpenAI 리소스가 선택되면 왼쪽 위 패널의 플레이그라운드에서 조기 액세스 플레이그라운드(미리 보기)를 선택합니다.

2024년 8월

GPT-4o 2024-08-06 구조화된 출력

모든 미국 지역 및 스웨덴 중부에서 표준 및 글로벌 배포에 사용할 수 있습니다.
이 모델은 구조화된 출력에 대한 지원을 추가합니다.

GPT-4o 미니 프로비전된 배포

GPT-4o 미니는 현재 캐나다 동부, 미국 동부, 미국 동부 2, 미국 중북부, 스웨덴 중부 지역에서 프로비전된 배포로 제공됩니다.

모델 가용성에 대한 최신 정보는 모델 페이지를 참조하세요.

GPT-4o 미세조정(공개 미리 보기)

GPT-4o 미세조정은 현재 미국 중북부와 스웨덴 중부 지역에서 Azure OpenAI로 제공됩니다.

자세한 내용은 블로그 게시물을 참조하세요.

새로운 미리 보기 API 릴리스

API 버전 2024-07-01-preview는 최신 데이터 평면 작성 및 유추 API 릴리스입니다. API 버전 2024-05-01-preview(을)를 대체하고 다음을 지원합니다.

Batch API 지원 추가
벡터 저장소 청크 전략 매개 변수
파일 검색 도구에서 출력해야 하는 max_num_results

자세한 내용은 참조 설명서를 참조하세요.

GPT-4o 미니 지역별 가용성

GPT-4o 미니는 현재 미국 동부와 스웨덴 중부 지역에서 표준 및 글로벌 표준 배포에 모두 사용할 수 있습니다.
GPT-4o 미니는 미국 동부와 미국 서부, 스웨덴 중부 지역에서 글로벌 배치 배포에 사용할 수 있습니다.

평가 가이드

모델 평가 시작에 대한 새로운 블로그 게시물. 이 가이드는 모델 업그레이드 및 사용 중지 프로세스의 일부로 사용하는 것이 좋습니다.

초기 액세스 플레이그라운드에서 사용할 수 있는 최신 GPT-4o 모델(미리 보기)

2024년 8월 6일, OpenAI는 플래그십 GPT-4o 모델 버전 2024-08-06의 최신 버전을 발표했습니다. GPT-4o 2024-08-06은 이전 버전의 모든 기능과 다음 기능을 갖추고 있습니다.

복잡한 구조적 출력을 지원하는 향상된 기능
최대 출력 토큰이 4,096에서 16,384로 증가함

Azure 고객은 새로운 Azure AI Foundry 초기 액세스 플레이그라운드(미리 보기)에서 GPT-4o 2024-08-06 를 테스트할 수 있습니다.

이전 초기 액세스 플레이그라운드와 달리 Azure AI Foundry 포털 초기 액세스 플레이그라운드(미리 보기)에서는 특정 지역에 리소스가 필요하지 않습니다.

참고 항목

초기 액세스 플레이그라운드(미리 보기)를 통해 수행된 프롬프트 및 완료는 모든 Azure OpenAI 지역에서 처리될 수 있으며 현재 Azure 구독 제한당 분당 10개의 요청이 적용됩니다. 이 제한은 나중에 변경될 수 있습니다.

수정이 승인된 경우에도 모든 초기 액세스 플레이그라운드 사용자가 Azure OpenAI Service 남용 모니터링을 사용할 수 있습니다. 기본 콘텐츠 필터는 사용 가능하지만 수정할 수 없습니다.

GPT-4o 2024-08-06을 테스트하려면, 이 링크를 사용하여 Azure AI 초기 액세스 플레이그라운드(미리 보기)에 로그인합니다.

이제 글로벌 일괄 처리 배포를 사용할 수 있음

주요 사용 사례는 다음과 같습니다.

대규모 데이터 처리: 방대한 데이터 세트를 병렬로 빠르게 분석합니다.
콘텐츠 생성: 제품 설명이나 문서 등 방대한 양의 텍스트를 만듭니다.
문서 검토 및 요약: 긴 문서의 검토 및 요약을 자동화합니다.
고객 지원 자동화: 더 빠른 응답을 위해 여러 문의를 동시에 처리합니다.
데이터 추출 및 분석: 방대한 양의 구조화되지 않은 데이터에서 정보를 추출하고 분석합니다.
NLP(자연어 처리) 작업: 대규모 데이터 세트에 대한 감정 분석이나 번역과 같은 작업을 수행합니다.
마케팅 및 개인 설정: 대규모로 개인 설정 콘텐츠와 권장 사항을 생성합니다.

글로벌 일괄 처리 배포 시작에 대한 자세한 내용은 다음을 참조합니다.

2024년 7월

GPT-4o mini를 이제 미세 조정에 사용할 수 있음

GPT-4o mini 미세 조정은 현재 스웨덴 중부 및 미국 중북부에서 공개 미리 보기로 제공됩니다.

도우미 파일 검색 도구는 이제 청구됨

도우미용 파일 검색 도구는 이제 사용에 대해 추가 요금이 부과됩니다. 자세한 내용은 가격 책정 페이지를 참조하세요.

GPT-4o 미니 모델이 배치 가능

GPT-4o mini는 2024년 7월 18일에 처음 공지된 최신 Azure OpenAI 모델입니다.

"GPT-4o mini를 사용하면 고객은 놀라운 속도와 저렴한 비용으로 놀라운 애플리케이션을 제공할 수 있습니다. GPT-4o mini는 GPT-3.5 Turbo보다 훨씬 더 스마트합니다. MMLU(Measuring Massive Multitask Language Understanding) 측정에서 82%를 기록한 반면 GPT-3.5 Turbo의 경우 70%를 기록했으며, 가격도 60% 이상 저렴합니다.1 이 모델은 확장된 128K 컨텍스트 창을 제공하고 GPT-4o의 개선된 다국어 기능을 통합하여 전 세계 언어의 품질을 더욱 개선합니다."

이 모델은 현재 미국 동부 지역에서 표준 및 글로벌 표준 배포 모두에 사용할 수 있습니다.

모델 할당량에 대한 정보는 할당량 및 한도 페이지를 참조하고 모델 가용성에 대한 최신 정보는 모델 페이지를 참조하세요.

새로운 책임 있는 AI 기본 콘텐츠 필터링 정책

새로운 기본 콘텐츠 필터링 정책 DefaultV2는 다음을 포함하여 GPT 모델 시리즈(텍스트)에 대한 최신 안전 및 보안 완화 기능을 제공합니다.

사용자 프롬프트(필터)에 대한 탈옥 공격을 위한 프롬프트 쉴드,
모델 완료 시 텍스트(필터)에 대한 보호자료감지
모델 완료 시 코드(주석 달기)에 대한 보호자료감지

기존 리소스 및 배포에 대한 콘텐츠 필터는 변경되지 않지만(기본 또는 사용자 지정 콘텐츠 필터링 구성은 변경되지 않음), 새 리소스 및 GPT 배포는 자동으로 새 콘텐츠 필터링 정책 DefaultV2를 상속합니다. 고객은 안전 기본값 사이에서 전환하고 사용자 지정 콘텐츠 필터링 구성을 만들 수 있습니다.

자세한 내용은 기본 안전 정책 설명서를 참조하세요.

새 GA API 릴리스

API 버전 2024-06-01(은)는 최신 GA 데이터 평면 유추 API 릴리스입니다. API 버전 2024-02-01(을)를 대체하고 다음을 지원합니다.

embeddings encoding_format 및 dimensions 매개 변수입니다.
채팅 완료 logprobs 및 top_logprobs 매개 변수

자세한 내용은 데이터 평면 유추 참조 설명서를 참조하세요.

GPT-4o의 글로벌 표준 배포에 사용할 수 있는 지역 확장

GPT-4o는 이제 다음에서 글로벌 표준 배포에 사용할 수 있습니다.

australiaeast
brazilsouth
canadaeast
eastus
eastus2
francecentral git
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
polandcentral
southafricanorth
southcentralus
southindia
스웨덴 중부
스위스 북부
uksouth
westeurope
westus
westus3

글로벌 표준 할당량에 대한 자세한 내용은 할당량 및 제한 페이지를 참조하세요.

2024년 6월

사용 중지 날짜 업데이트

gpt-35-turbo 0301 사용 중지 날짜가 2024년 10월 1일 이후로 업데이트되었습니다.
gpt-35-turbo & gpt-35-turbo-16k 0613 사용 중지 날짜가 2024년 10월 1일로 업데이트되었습니다.
gpt-4 & gpt-4-32k 0314 구식화 날짜는 2024년 10월 1일로, 사용 중지 날짜는 2025년 6월 6일로 업데이트되었습니다.

모델 구식화 및 사용 중지에 대한 최신 정보는 모델 사용 중지 가이드를 참조하세요.

미세 조정을 위한 토큰 기반 청구

Azure OpenAI 미세 조정 청구는 이제 총 경과된 학습 시간이 아닌 학습 파일의 토큰 수를 기반으로 합니다. 이를 통해 일부 학습 실행에 대한 비용이 크게 절감될 수 있으며 미세 조정 비용을 훨씬 쉽게 추정할 수 있습니다. 자세한 내용은 공식 공지 사항을 참조하세요.

새로운 지역에서 릴리스된 GPT-4o

GPT-4o는 이제 다음 국가에서도 사용할 수 있습니다.
- 표준 지역 배포를 위한 스웨덴 중부.
- 프로비전된 배포를 위한 오스트레일리아 동부, 캐나다 동부, 일본 동부, 한국 중부, 스웨덴 중부, 스위스 북부 및 미국 서부 3개.

모델 가용성에 대한 최신 정보는 모델 페이지를 참조하세요.

도우미에 대한 CMK(고객 관리형 키) 지원

도우미의 스레드 및 파일은 이제 다음 지역에서 CMK를 지원합니다.

미국 서부 3

2024년 5월

GPT-4o 프로비전 배포

gpt-4o 버전: 2024-05-13은(는) 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 프로비전 및 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다. 모델 지역 가용성에 대한 자세한 내용은 프로비전된 배포에 대한 모델 매트릭스를 참조하세요.

도우미 v2(미리 보기)

이제 도우미 API의 새로 고침이 공개적으로 제공됩니다. 여기에는 다음 업데이트가 포함되어 있습니다.

파일 검색 도구 및 벡터 스토리지
토큰 사용 관리를 위한 최대 완료 및 최대 프롬프트 토큰 지원
도우미가 지정된 도구를 사용하도록 강제하는 tool_choice 매개 변수입니다. 이제 보조 역할로 메시지를 작성하여 스레드에서 사용자 지정 대화 기록을 만들 수 있습니다.
temperature, top_p, response_format 매개 변수를 지원합니다.
스트리밍 및 폴링 지원. Python SDK의 도우미 함수를 사용하여 실행을 만들고 응답을 스트리밍할 수 있습니다. 또한 폴링 없이 개체 상태 업데이트를 공유하기 위해 폴링 SDK 도우미를 추가했습니다.
Azure OpenAI 스튜디오를 사용하여 Logic Apps 및 함수 호출을 실험해 보세요. Logic Apps에 구현된 REST API를 함수로 가져오면 스튜디오는 사용자 프롬프트에 따라 자동으로 함수(Logic Appss 워크플로로)를 호출합니다.
Microsoft Research의 AutoGen은 다양한 애플리케이션에서 LLM(대규모 언어 모델) 워크플로를 편리하게 빌드할 수 있도록 다중 에이전트 대화 프레임워크를 제공합니다. Azure OpenAI 도우미는 이제 AutoGen 기반 다중 에이전트 워크플로에 도우미를 원활하게 추가할 수 있는 새로운 실험용 에이전트인 GPTAssistantAgent를 통해 AutoGen에 통합되었습니다. 이를 통해 작업 또는 도메인에 특화된 여러 Azure OpenAI 도우미가 복잡한 작업을 공동 작업하고 처리할 수 있습니다.
다음 지역에서 미세 조정된 gpt-3.5-turbo-0125 모델을 지원합니다.
- 미국 동부 2
- 스웨덴 중부
다음에 대한 지역별 지원 확대:
- 일본 동부
- 영국 남부
- 미국 서부
- 미국 서부 3
- 노르웨이 동부

자세한 내용은 도우미에 대한 블로그 게시물을 참조하세요.

GPT-4o 모델 GA(일반 공급)

GPT-4o("o는 "omni"를 의미함)는 2024년 5월 13일에 출시된 OpenAI의 최신 모델입니다.

GPT-4o는 텍스트와 이미지를 단일 모델로 통합하여 여러 데이터 형식을 동시에 처리할 수 있습니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다.
GPT-4o는 영어 텍스트 및 코딩 작업에서 GPT-4 Turbo와 일치하는 동시에 영어가 아닌 언어 및 비전 작업에서 탁월한 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

모델 지역별 사용 가능 여부에 대한 자세한 내용은 모델 페이지를 참조하세요.

글로벌 표준 배포 유형(미리 보기)

글로벌 배포는 비전역 서비스와 동일한 Azure OpenAI 리소스에서 사용할 수 있지만 Azure의 글로벌 인프라를 활용하여 각 요청에 대해 최상의 가용성을 제공하면서 트래픽을 데이터 센터로 동적으로 라우팅할 수 있습니다. 글로벌 표준은 새 모델에 대해 가장 높은 기본 할당량을 제공하고 여러 리소스에 부하를 분산할 필요가 없습니다.

자세한 내용은 배포 유형 가이드를 참조하세요.

미세 조정 업데이트

GPT-4 미세 조정은 이제 공개 미리 보기에서 사용할 수 있습니다.
2024-05-01-preview API 릴리스의 일부로 시드, 이벤트, 전체 유효성 검사 통계 및 검사점 지원이 추가되었습니다.

DALL-E 및 GPT-4 Turbo Vision GA 구성 가능 콘텐츠 필터

DALL-E 2 및 3, GPT-4 Turbo with Vision GA(turbo-2024-04-09) 그리고 GPT-4o 배포를 위한 사용자 지정 콘텐츠 필터를 만듭니다. 콘텐츠 필터링

모든 Azure OpenAI 고객이 사용할 수 있는 비동기 필터

이제 모든 Azure OpenAI 고객은 스트리밍 시나리오의 대기 시간 개선을 위해 필터를 비동기식으로 실행할 수 있습니다. 콘텐츠 필터링

Prompt Shields

프롬프트 쉴드는 직접(탈옥) 공격과 간접 공격이라는 두 가지 형식의 공격으로부터 Azure OpenAI 모델로 구동되는 애플리케이션을 보호합니다. 간접 공격(간접 프롬프트 공격 또는 도메인 간 프롬프트 삽입 공격이라고도 함)은 애플리케이션이 애플리케이션 개발자 또는 사용자가 직접 작성하지 않은 정보를 처리할 때 발생할 수 있는 생성 AI 모델에 의해 구동되는 시스템에 대한 공격 유형입니다. 콘텐츠 필터링

2024-05-01-preview API 릴리스

자세한 내용은 API 버전 수명 주기를 참조하세요.

GPT-4 Turbo 모델 GA(일반 공급)

GPT-4 Turbo의 최신 GA 릴리스는 다음과 같습니다.

gpt-4 버전: turbo-2024-04-09

이는 다음 미리 보기 모델을 대체합니다.

gpt-4 버전: 1106-Preview
gpt-4 버전: 0125-Preview
gpt-4 버전: vision-preview

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

OpenAI의 최신 0409 터보 모델 버전은 JSON 모드와 모든 유추 요청에 대한 함수 호출을 지원합니다.
Azure OpenAI의 최신 turbo-2024-04-09 버전은 현재 이미지(비전) 입력으로 유추 요청을 할 때 JSON 모드 및 함수 호출 사용을 지원하지 않습니다. 텍스트 기반 입력 요청(image_url 및 인라인 이미지가 없는 요청)은 JSON 모드 및 함수 호출을 지원합니다.

gpt-4 vision-preview와의 차이점

GPT-4 Turbo with Vision과 Azure AI 관련 Vision 개선 사항 통합은 gpt-4 버전: turbo-2024-04-09에서는 지원되지 않습니다. 여기에는 OCR(광학 인식), 개체 근거 있는, 동영상 프롬프트 및 이미지가 포함된 데이터 처리 개선이 포함됩니다.

Important

OCR(광학 인식), 개체 그라운딩, 동영상 프롬프트를 포함한 비전 향상 미리 보기 기능은 gpt-4 버전: vision-preview가 turbo-2024-04-09로 업그레이드되면 더 이상 사용할 수 없습니다. 현재 이러한 미리 보기 기능 중 하나라도 사용하고 있는 경우, 이 자동 모델 업그레이드는 호환성이 손상되는 변경이 됩니다.

GPT-4 Turbo 프로비전된 관리 가용성

gpt-4 버전: turbo-2024-04-09은(는) 표준 배포와 프로비전 배포 모두에 사용할 수 있습니다. 현재 이 모델의 프로비전된 버전은 이미지/비전 유추 요청을 지원하지 않습니다. 이 모델의 프로비전된 배포에서는 텍스트 입력만 허용됩니다. 표준 모델 배포는 텍스트 및 이미지/비전 유추 요청을 모두 허용합니다.

GPT-4 Turbo with Vision GA 배포

Azure AI Foundry 포털에서 GA 모델을 배포하려면 드롭다운 메뉴에서 버전을 선택하고 GPT-4 선택합니다 turbo-2024-04-09 . gpt-4-turbo-2024-04-09 모델의 기본 할당량은 GPT-4-Turbo의 현재 할당량과 동일합니다. 지역별 할당량 한도를 참조하세요.

2024년 4월

이제 미국 동부 2와 스위스 서부 두 개의 새로운 지역에서 미세 조정이 지원됩니다.

이제 다음을 지원하여 미세 조정이 가능합니다.

미국 동부 2

gpt-35-turbo(0613)
gpt-35-turbo(1106)
gpt-35-turbo(0125)

스위스 서부

babbage-002
davinci-002
gpt-35-turbo(0613)
gpt-35-turbo(1106)
gpt-35-turbo(0125)

각 지역의 모델 가용성 및 미세 조정 지원에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

다단계 채팅 학습 예

이제 미세 조정에서 다단계 채팅 학습 예를 지원합니다.

GPT-4(0125)는 Azure OpenAI On Your Data에서 사용할 수 있음

이제 Azure OpenAI On Your Data를 통해 사용 가능한 지역에서 GPT-4(0125) 모델을 사용할 수 있습니다.

2024년 3월

Azure OpenAI 스튜디오의 위험 및 안전 모니터링

이제 Azure OpenAI 스튜디오는 콘텐츠 필터 구성을 사용하는 각 배포에 대한 위험 및 안전 대시보드를 제공합니다. 필터링 작업의 결과를 확인하는 데 사용합니다. 그런 다음, 필터 구성을 조정하여 비즈니스 요구 사항을 더 잘 충족하고 책임 있는 AI 원칙을 충족할 수 있습니다.

위험 및 안전 모니터링 사용

Azure OpenAI On Your Data 업데이트

이제 Azure OpenAI On Your Data를 사용할 Elasticsearch 벡터 데이터베이스에 연결할 수 있습니다.
데이터 수집 중에 청크 크기 매개 변수를 사용하여 인덱스에 지정된 데이터 청크의 최대 토큰 수를 설정할 수 있습니다.

2024-02-01 GA(일반 공급) API 릴리스

최신 GA API 릴리스이며 이전 2023-05-15 GA 릴리스를 대체합니다. 이 릴리스에서는 위스퍼, DALLE-3, 미세 조정, 데이터 등과 같은 최신 Azure OpenAI GA 기능에 대한 지원을 추가합니다.

도우미, TTS(텍스트 음성 변환) 및 일부 "데이터" 데이터 원본과 같은 미리 보기에 있는 기능에는 미리 보기 API 버전이 필요합니다. 자세한 내용은 API 버전 수명 주기 가이드를 확인하세요.

Whisper GA(일반 공급)

이제 Whisper 음성 텍스트 변환 모델은 REST 및 Python 모두에 대한 GA입니다. 클라이언트 라이브러리 SDK는 현재 공개 미리 보기로 제공됩니다.

빠른 시작에 따라 Whisper를 사용해 보세요.

DALL-E 3 GA(일반 공급)

DALL-E 3 이미지 생성 모델은 이제 REST 및 Python 모두에 대한 GA입니다. 클라이언트 라이브러리 SDK는 현재 공개 미리 보기로 제공됩니다.

빠른 시작에 따라 DALL-E 3를 사용해 보세요.

DALL-E 3에 대한 새로운 지역 지원

이제 SwedenCentral 외에도 East US 또는 AustraliaEast Azure 지역에서 Azure OpenAI 리소스를 사용하여 DALL-E 3에 액세스할 수 있습니다.

모델 사용 중단 및 사용 중지

Azure OpenAI Service에서 모델 사용 중단 및 사용 중지를 추적하는 페이지가 추가되었습니다. 이 페이지에서는 현재 사용 가능하고, 사용되지 않으며, 사용 중지된 모델에 대한 정보를 제공합니다.

2024-03-01-preview API 릴리스

2024-03-01-preview는 2024-02-15-preview와 동일한 기능을 가지며 포함에 대해 두 개의 새 매개 변수를 추가합니다.

encoding_format은 float 또는 base64의 포함을 생성하는 형식을 지정할 수 있습니다. 기본값은 float입니다.
dimensions는 출력 포함 수를 설정할 수 있습니다. 이 매개 변수는 새 3세대 포함 모델(text-embedding-3-large, text-embedding-3-small)에서만 지원됩니다. 일반적으로 더 큰게 포함되면 컴퓨팅, 메모리 및 스토리지 관점에서 더 비쌉니다. 차원 수를 조정할 수 있게 되므로 전체 비용 및 성능을 더 많이 제어할 수 있습니다. 매개 변수는 dimensions 모든 버전의 OpenAI 1.x Python 라이브러리에서 지원되지 않습니다. 이 매개 변수를 활용하려면 최신 버전 pip install openai --upgrade으로 업그레이드하는 것이 좋습니다.

현재 미리 보기 API 버전을 사용하여 최신 기능을 활용하는 경우 API 버전 수명 주기 문서를 참조하여 현재 API 버전이 지원되는 기간을 추적하는 것이 좋습니다.

GPT-4-1106-Preview 업그레이드 플랜으로 업데이트

2024년 3월 8일로 예정된 gpt-4 1106-Preview를 gpt-4 0125-Preview로의 배포 업그레이드는 더 이상 진행되지 않습니다. 안정적인 버전의 모델이 릴리스된 후 gpt-4 버전 1106-Preview 및 0125-Preview가 "기본값으로 자동 업데이트" 및 "만료된 경우 업그레이드"로 설정된 배포가 업그레이드되기 시작합니다.

업그레이드 프로세스에 대한 자세한 내용은 모델 페이지를 참조하세요.

2024년 2월

GPT-3.5-turbo-0125 모델 사용 가능

이 모델에는 요청된 형식의 응답 정확도 향상 및 영어 이외의 언어 함수 호출에 대한 텍스트 인코딩 문제를 발생시킨 버그 수정 등 다양한 개선 사항이 있습니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

3세대 포함 모델 사용 가능

text-embedding-3-large
text-embedding-3-small

테스트에서 OpenAI는 2세대 text-embedding-ada-002 모델보다 MTEB 벤치마크를 사용하여 영어 작업에 대해 더 나은 성능을 계속 유지하면서 MIRACL 벤치마크를 통해 크고 작은 3세대 포함 모델이 더 나은 평균 다국어 검색 성능을 제공한다고 보고합니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

GPT-3.5 Turbo 할당량 통합

다양한 버전의 GPT-3.5-Turbo 모델(16k 포함) 간의 마이그레이션을 간소화하기 위해 모든 GPT-3.5-Turbo 할당량을 단일 할당량 값으로 통합합니다.

승인된 할당량을 늘인 고객은 이전 증가를 반영하는 총 할당량을 합산합니다.
모델 버전에서 현재 총사용량이 기본값보다 작은 고객은 기본적으로 새롭게 결합된 총 할당량을 받게 됩니다.

GPT-4-0125-preview 모델 사용 가능

gpt-4 모델 버전 0125-preview를 이제 미국 동부, 미국 중북부 및 미국 중남부 지역의 Azure OpenAI Service에서 사용할 수 있습니다. gpt-4 버전 1106-preview가 배포된 고객은 앞으로 몇 주 안에 자동으로 0125-preview로 업그레이드됩니다.

모델 지역 가용성 및 업그레이드에 대한 자세한 내용은 모델 페이지를 참조하세요.

도우미 API 공개 미리 보기

이제 Azure OpenAI는 OpenAI의 GPT를 구동하는 API를 지원합니다. Azure OpenAI 도우미(미리 보기)를 사용하면 사용자 지정 지침과 코드 해석기 및 사용자 지정 함수 같은 고급 도구를 통해 필요에 맞게 조정된 AI 도우미를 만들 수 있습니다. 자세한 내용은 다음을 참조하세요.

OpenAI 텍스트 음성 변환 음성 공개 미리 보기

이제 Azure OpenAI Service는 OpenAI의 음성을 사용하여 텍스트 음성 변환 API를 지원합니다. 제공하는 텍스트에서 AI 생성 음성을 가져오세요. 자세한 내용은 개요 가이드를 참조하고, 빠른 시작을 사용해 보세요.

참고 항목

Azure AI 음성은 OpenAI 텍스트 음성 변환 음성도 지원합니다. 자세한 내용은 Azure OpenAI Service 또는 Azure AI 음성을 통한 OpenAI 텍스트 음성 음성 가이드를 참조하세요.

새로운 미세 조정 기능 및 모델 지원

Azure OpenAI On Your Data에 대한 새로운 지역 지원

이제 다음 Azure 지역에서 Azure OpenAI On Your Data를 사용할 수 있습니다.

남아프리카 공화국 북부

Azure OpenAI On Your Data 일반 공급

이제 Azure OpenAI On Your Data가 일반 공급됩니다.

2023년 12월

데이터에 대한 Azure OpenAI

스토리지 계정, Azure OpenAI 리소스, Azure AI 검색 서비스 리소스에 대한 보안 지원을 포함하여 Azure OpenAI On Your Data에 대한 전체 VPN 및 프라이빗 엔드포인트 지원.
가상 네트워크 및 프라이빗 엔드포인트를 사용하여 데이터를 보호하여 Azure OpenAI On Your Data 구성을 사용하기 위한 새로운 문서입니다.

GPT-4 Turbo with Vision 이제 사용 가능

Azure OpenAI Service의 GPT-4 Turbo with Vision은 현재 공개 미리 보기입니다. GPT-4 Turbo with Vision은 이미지를 분석하고 이미지에 대한 질문에 대한 텍스트 응답을 제공할 수 있는 OpenAI에서 개발한 LMM(대형 다중 모드 모델)입니다. 이는 자연어 처리와 시각적 이해를 모두 통합합니다. 향상된 모드에서는 Azure AI 비전 기능을 사용하여 이미지에서 추가 인사이트를 생성할 수 있습니다.

Azure OpenAI Playground를 사용하여 코드 없는 환경에서 GPT-4 Turbo with Vision의 기능을 살펴보세요. 빠른 시작 가이드에서 자세히 알아보세요.
GPT-4 Turbo with Vision을 사용한 비전 향상 기능은 이제 Azure OpenAI Playground에서 사용할 수 있으며 광학 문자 인식, 개체 접지, "데이터 추가"에 대한 이미지 지원 및 비디오 프롬프트에 대한 지원을 포함합니다.
REST API를 사용하여 채팅 API를 직접 호출합니다.
지역 가용성은 현재 SwitzerlandNorth, SwedenCentral, WestUS, AustraliaEast로 제한됩니다.
GPT-4 Turbo with Vision의 알려진 제한 사항 및 기타 질문과 대답에 대해 자세히 알아보세요.

2023년 11월

Azure OpenAI On Your Data의 새 데이터 원본 지원

이제 Azure Cosmos DB for MongoDB vCore 및 URL/웹 주소를 데이터 원본으로 사용하여 데이터를 수집하고 지원되는 Azure OpenAI 모델과 채팅할 수 있습니다.

GPT-4 Turbo 미리 보기 및 GPT-3.5-Turbo-1106 릴리스

두 모델 모두 향상된 명령 따르기, JSON 모드, 재현 가능한 출력 및 병렬 함수 호출이 포함된 OpenAI의 최신 릴리스입니다.

GPT-4 Turbo 미리 보기에는 128,000개 토큰의 최대 컨텍스트 창이 있으며, 4,096개의 출력 토큰을 생성할 수 있습니다. 2023년 4월까지의 정보가 포함된 최신 교육 데이터가 있습니다. 이 모델은 미리 보기로 제공되며 프로덕션 용도에는 권장되지 않습니다. 안정적인 릴리스를 사용할 수 있게 되면 이 미리 보기 모델의 모든 배포가 자동으로 업데이트됩니다.
GPT-3.5-Turbo-1106에는 16,385개 토큰의 최대 컨텍스트 창이 있으며, 4,096개의 출력 토큰을 생성할 수 있습니다.

모델 지역 가용성에 대한 자세한 내용은 모델 페이지를 참조하세요.

모델에는 지역별로 고유한 할당량 할당이 있습니다.

DALL-E 3 공개 미리 보기

DALL-E 3는 OpenAI의 최신 이미지 생성 모델입니다. 이미지에서 텍스트를 렌더링할 때 향상된 이미지 품질, 더 복잡한 장면, 향상된 성능을 제공합니다. 또한 더 많은 가로 세로 비율 옵션도 함께 제공됩니다. DALL-E 3는 OpenAI 스튜디오와 REST API를 통해 사용할 수 있습니다. OpenAI 리소스가 SwedenCentral Azure 지역에 있어야 합니다.

DALL-E 3에는 이미지를 향상시키고, 편견을 줄이고, 자연스러운 변화를 높이기 위한 기본 제공 프롬프트 다시 쓰기가 포함되어 있습니다.

빠른 시작에 따라 DALL-E 3를 사용해 보세요.

책임 있는 AI

확장된 고객 구성 가능성: 이제 모든 Azure OpenAI 고객은 높은 심각도 콘텐츠만 필터링하는 것을 포함하여 증오, 폭력, 성적, 자해 범주의 모든 심각도 수준(낮음, 중간, 높음)을 구성할 수 있습니다. 콘텐츠 필터 구성
모든 DALL-E 모델의 콘텐츠 자격 증명: 이제 모든 DALL-E 모델의 AI 생성 이미지에 AI 생성으로 콘텐츠를 공개하는 디지털 자격 증명이 포함됩니다. 이미지 자산을 표시하는 애플리케이션은 오픈 소스 콘텐츠 인증 이니셔티브 SDK 를 활용하여 AI 생성 이미지에 자격 증명을 표시할 수 있습니다. Azure OpenAI의 콘텐츠 자격 증명
새 RAI 모델
- 탈옥 감지: 탈옥 공격은 시스템 메시지에 설정된 규칙을 피하거나 위반하도록 학습된 동작을 보이도록 생성 AI 모델을 자극하도록 설계된 사용자 프롬프트입니다. 탈옥 위험 감지 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 사용자 프롬프트에서 실행됩니다.
- 보호 자료 텍스트: 보호 자료 텍스트는 대규모 언어 모델에서 출력할 수 있는 알려진 텍스트 콘텐츠(예: 노래 가사, 문서, 조리법 및 선택한 웹 콘텐츠)를 설명합니다. 보호 자료 텍스트 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 LLM 완성 시 실행됩니다.
- 보호 자료 코드: 보호 자료 코드는 공용 리포지토리의 소스 코드 집합과 일치하는 소스 코드를 설명하며, 원본 리포지토리를 적절하게 인용하지 않고도 대규모 언어 모델로 출력할 수 있습니다. 보호 자료 코드 모델은 선택 사항(기본값 해제)이며, 주석 및 필터 모델에서 사용할 수 있습니다. 이 모델은 LLM 완성 시 실행됩니다.
콘텐츠 필터 구성
차단 목록: 고객은 이제 필터에 사용자 지정 차단 목록을 만들어 프롬프트 및 완성을 위한 콘텐츠 필터 동작을 빠르게 사용자 지정할 수 있습니다. 사용자 지정 차단 목록을 통해 필터는 특정 용어 또는 정규식 패턴과 같은 사용자 지정된 패턴 목록에 대한 작업을 수행할 수 있습니다. Microsoft는 사용자 지정 차단 목록 외에도 Microsoft 욕설 차단 목록(영어)을 제공합니다. 차단 목록 사용

2023년 10월

새 미세 조정 모델(미리 보기)

gpt-35-turbo-0613을 이제 미세 조정에 사용할 수 있습니다.
babbage-002 및 davinci-002을 이제 미세 조정에 사용할 수 있습니다. 이러한 모델은 이전에 미세 조정에 사용할 수 있었던 레거시 ada, babbage, curie, davinci 기본 모델을 대체합니다.
미세 조정 가용성은 특정 지역으로 제한됩니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.
미세 조정된 모델에는 일반 모델과 다른 할당량 한도가 있습니다.
자습서: GPT-3.5-Turbo 미세 조정

데이터에 대한 Azure OpenAI

검색된 문서 수와 엄격성을 확인하기 위한 새 사용자 지정 매개 변수.
- 엄격성 설정은 쿼리와 관련된 문서를 분류하는 임계값을 설정합니다.
- 검색된 문서 설정은 응답을 생성하는 데 사용되는 데이터 인덱스에서 최고 점수 문서의 수를 지정합니다.
Azure OpenAI 스튜디오에서 데이터 수집/업로드 상태를 볼 수 있습니다.
Blob 컨테이너의 프라이빗 엔드포인트 및 VPN 지원.

2023년 9월

GPT-4

이제 모든 Azure OpenAI Service 고객이 GPT-4 및 GPT-4-32k를 사용할 수 있습니다. 고객은 더 이상 GPT-4와 GPT-4-32k를 사용하기 위해 대기 목록을 신청할 필요가 없습니다(제한된 액세스 등록 요구 사항은 모든 Azure OpenAI 모델에 계속 적용됨). 가용성은 지역에 따라 달라질 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

GPT-3.5 Turbo Instruct

이제 Azure OpenAI Service는 GPT-3.5 Turbo Instruct 모델을 지원합니다. 이 모델은 text-davinci-003과 성능이 비슷하며, 완성 API와 함께 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

Whisper 공개 미리 보기

Azure OpenAI 서비스는 이제 OpenAI의 Whisper 모델에서 제공하는 음성 텍스트 변환 API를 지원합니다. 제공하는 음성 오디오를 기반으로 AI에서 생성된 텍스트를 가져옵니다. 자세히 알아보려면 빠른 시작을 확인하세요.

참고 항목

또한 Azure AI 음성은 일괄 처리 대화 기록 API를 통해 OpenAI의 Whisper 모델을 지원합니다. 자세한 내용은 일괄 처리 대화 내용 기록 만들기 가이드를 확인해 보세요. Azure AI 음성과 Azure OpenAI Service를 언제 사용해야 하는지 자세히 알아보려면 Whisper 모델이란?을 확인하세요.

새 지역

Azure OpenAI는 이제 스웨덴 중부 및 스위스 북부 지역에서도 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

지역 할당량 한도 증가

특정 모델 및 지역에 대한 최대 기본 할당량 한도가 늘어납니다. 이러한 모델 및 지역으로 워크로드를 마이그레이션하면 TPM(분당 더 높은 토큰)을 활용할 수 있습니다.

2023년 8월

자체 데이터에 대한 Azure OpenAI(미리 보기) 업데이트

이제 Azure OpenAI On Your Data를 Power Virtual Agents에 배포할 수 있습니다.
Azure OpenAI On Your Data가 이제 프라이빗 엔드포인트를 지원합니다.
중요한 문서에 대한 액세스를 필터링하는 기능입니다.
일정에 따라 인덱스가 자동으로 새로 고칩니다.
벡터 검색 및 의미 체계 검색 옵션
배포된 웹앱에서 채팅 기록 보기

2023년 7월

함수 호출 지원

Azure OpenAI는 이제 채팅 완료 API에서 기능을 사용할 수 있도록 함수 호출을 지원합니다.

기본 제공 입력 배열 증가

Azure OpenAI는 이제 text-embedding-ada-002 버전 2를 사용하여 API 요청당 최대 16개의 입력이 있는 배열을 지원합니다.

새 지역

Azure OpenAI는 이제 캐나다 동부, 미국 동부 2, 일본 동부 및 미국 중북부 지역에서도 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

2023년 6월

자체 데이터에 Azure OpenAI 사용(미리 보기)

Azure OpenAI On Your Data가 이제 미리 보기로 제공됩니다. 이를 통해 GPT-35-Turbo 및 GPT-4와 같은 OpenAI 모델과 채팅하고 데이터를 기반으로 응답을 받을 수 있습니다.

gpt-35-turbo 및 gpt-4 모델의 새 버전

gpt-35-turbo (버전 0613)
gpt-35-turbo-16k (버전 0613)
gpt-4(버전 0613)
gpt-4-32k(버전 0613)

영국 남부

이제 Azure OpenAI를 영국 남부 지역에서 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

콘텐츠 필터링 및 주석(미리 보기)

Azure OpenAI Service로 콘텐츠 필터를 구성하는 방법.
GPT 기반 완료 및 채팅 완료 호출의 일부로 콘텐츠 필터링 카테고리 및 심각도 정보를 보려면 주석을 활성화하세요.

할당량

할당량은 구독 내에서 배포 전반에 걸쳐 비율 제한 할당을 적극적으로 관리할 수 있는 유연성을 제공합니다.

2023년 5월

Java 및 JavaScript SDK 지원

JavaScript 및 Java를 지원하는 새로운 Azure OpenAI 미리 보기 SDK.

Azure OpenAI 채팅 완료 일반 공급(GA)

다음에 대한 일반 가용성 지원:
- 채팅 완료 API 버전 2023-05-15.
- GPT-35-터보 모델.
- GPT-4 모델 시리즈.

현재 API를 2023-03-15-preview 사용하는 경우 GA 2023-05-15 API로 마이그레이션하는 것이 좋습니다. 현재 API 버전을 2022-12-01 사용하는 경우 이 API는 GA로 유지되지만 최신 채팅 완료 기능은 포함하지 않습니다.

Important

완료 엔드포인트가 있는 GPT-35-Turbo 모델의 현재 버전을 사용하는 것은 미리 보기 상태로 유지됩니다.

프랑스 중부

이제 Azure OpenAI를 프랑스 중부 지역에서 사용할 수 있습니다. 각 지역의 모델 가용성에 대한 최신 정보를 보려면 모델 페이지를 확인하세요.

2023년 4월

DALL-E 2 공개 미리 보기. Azure OpenAI Service는 이제 OpenAI의 DALL-E 2 모델을 기반으로 하는 이미지 생성 API를 지원합니다. 귀하가 제공한 설명 텍스트를 기반으로 AI 생성 이미지를 가져옵니다. 자세히 알아보려면 빠른 시작을 확인하세요.
사용자 지정된 모델의 비활성 배포는 이제 15일 후에 삭제됩니다. 모델은 재배포가 가능한 상태로 유지됩니다. 사용자 지정된(미세 조정된) 모델이 15일 이상 배포되고, 이 기간 동안 완료되거나 채팅이 완료되지 않으면 배포는 자동으로 삭제됩니다(해당 배포에 대한 추가 호스팅 비용은 발생하지 않습니다). 기본 사용자 지정된 모델은 계속 사용 가능하며 언제든지 다시 배포할 수 있습니다. 자세한 내용은 방법 도움말을 확인하세요.

2023년 3월

GPT-4 시리즈 모델은 이제 Azure OpenAI에서 미리 보기로 제공됩니다. 액세스를 요청하려면 기존 Azure OpenAI 고객이 이 양식을 작성하여 신청할 수 있습니다. 이러한 모델은 현재 미국 동부 및 미국 중남부 지역에서 사용할 수 있습니다.
3월 21일 미리 보기로 출시된 GPT-35-Turbo 및 GPT-4 모델용 새로운 Chat Completion API. 자세히 알아보려면 업데이트된 빠른 시작 및 방법 문서를 확인합니다.
GPT-35-터보 미리 보기. 자세한 내용은 방법 문서를 참조하세요.
미세 조정을 위한 학습 제한 증가: 최대 학습 작업 크기(학습 파일의 토큰) x(epoch 수)는 모든 모델에 대해 20억 토큰입니다. 또한 최대 학습 작업을 120시간에서 720시간으로 늘렸습니다.
기존 액세스에 추가 사용 사례를 추가합니다. 이전에는 새로운 사용 사례를 추가하려면 고객이 서비스에 다시 신청해야 했습니다. 이제 서비스 사용에 새로운 사용 사례를 신속하게 추가할 수 있는 새로운 프로세스를 출시합니다. 이 프로세스는 Azure AI 서비스 내에 설정된 제한된 액세스 프로세스를 따릅니다. 기존 고객은 여기에서 모든 새로운 사용 사례를 증명할 수 있습니다. 이는 사용자가 원래 신청하지 않았던 새 사용 사례의 서비스를 사용하고자 할 때마다 필요합니다.

2023년 2월

새로운 기능

.NET SDK(유추) 미리 보기 릴리스 | 샘플
Azure OpenAI 관리 작업을 지원하기 위한 Terraform SDK 업데이트
이제 완료 끝에 텍스트 삽입이 suffix 매개 변수로 지원됩니다.

업데이트

콘텐츠 필터링은 기본적으로 켜져 있습니다.

새로운 문서:

새로운 학습 과정:

Azure OpenAI 소개

2023년 1월

새로운 기능

서비스 GA. 이제 Azure OpenAI 서비스가 일반 공급됩니다.
새 모델: 최신 텍스트 모델인 text-davinci-003(미국 동부, 서유럽), text-ada-embeddings-002(미국 동부, 미국 중남부, 서유럽) 추가

2022년 12월

새로운 기능

OpenAI의 최신 모델입니다. Azure OpenAI는 GPT-3.5 시리즈를 포함한 모든 최신 모델에 대한 액세스를 제공합니다.
새로운 API 버전(2022-12-01). 이 업데이트에는 API 응답의 토큰 사용 정보, 파일에 대한 개선된 오류 메시지, 미세 조정 만들기 데이터 구조에 대한 OpenAI와의 맞춤, 미세 조정 작업의 사용자 지정 명명을 허용하는 접미사 매개 변수 지원을 포함하여 요청된 몇 가지 개선 사항이 포함되어 있습니다.
초당 요청 제한이 더 높습니다. Davinci가 아닌 모델의 경우 50입니다. Davinci 모델의 경우 20개입니다.
배포를 더 빠르게 미세 조정합니다. 10분 이내에 Ada 및 Curie 미세 조정 모델을 배포합니다.
높은 학습 한도: Ada, Babbage 및 Curie에 대한 4천만 개의 학습 토큰. Davinci의 경우 10M입니다.
남용 및 오용 데이터 로깅 및 인간의 검토에 대한 수정 요청 프로세스입니다. 현재 이 서비스는 이러한 강력한 모델이 남용되지 않도록 남용 및 오용 검색 목적으로 요청/응답 데이터를 로그합니다. 그러나 많은 고객이 자신의 데이터에 대한 더 많은 제어가 필요한 엄격한 데이터 개인 정보 보호 및 보안 요구 사항을 가지고 있습니다. 이러한 사용 사례를 지원하기 위해 고객이 콘텐츠 필터링 정책을 수정하거나 위험도가 낮은 사용 사례에 대한 남용 기록을 해제할 수 있는 새로운 프로세스를 출시하고 있습니다. 이 프로세스는 Azure AI 서비스 내에 확립된 제한된 액세스 프로세스를 따르며 기존 OpenAI 고객은 여기에서 신청할 수 있습니다.
CMK(고객 관리형 키) 암호화. CMK는 학습 데이터 및 사용자 지정된 모델을 저장하는 데 사용되는 자체 암호화 키를 제공하여 고객이 Azure OpenAI에서 데이터 관리를 보다 효과적으로 제어할 수 있도록 합니다. CMK(고객 관리 키)(BYOK(Bring Your Own Key)라고도 함)를 사용하여 훨씬 더 유연하게 액세스 제어를 만들고, 회전하고, 해제하고, 취소할 수 있습니다. 데이터를 보호하는 데 사용되는 암호화 키를 감사할 수도 있습니다. 유휴 데이터 암호화 설명서에서 자세히 알아봅니다.
Lockbox 지원
SOC-2 준수
Azure Resource Health, 비용 분석 및 메트릭 및 진단 설정을 통한 로깅 및 진단.
스튜디오 개선. 미세 조정된 모델을 만들고 배포할 수 있는 액세스 권한이 있는 팀을 제어하기 위한 Azure AD 역할 지원을 포함하여 Studio 워크플로에 대한 수많은 유용성 개선.

변경 내용(중단)

미세 조정 만들기 API 요청이 OpenAI의 스키마와 일치하도록 업데이트되었습니다.

미리 보기 API 버전:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API 버전 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

기본적으로 콘텐츠 필터링은 일시적으로 꺼져 있습니다. Azure 콘텐츠 조정은 Azure OpenAI와 다르게 작동합니다. Azure OpenAI는 생성 호출 중에 콘텐츠 필터를 실행하여 유해하거나 악의적인 콘텐츠를 검색하고 응답에서 필터링합니다. 자세한 정보

이러한 모델은 2023년 1분기에 다시 사용되며 기본적으로 켜집니다.

고객 작업

구독에서 이 기능을 켜려면 Azure 지원팀에 문의하세요.
필터링을 해제한 상태로 유지하려면 필터링 수정을 신청합니다. (이 옵션은 위험도가 낮은 사용 사례에만 해당됩니다.)

다음 단계

Azure OpenAI를 지원하는 기본 모델에 대해 자세히 알아봅니다.

다음을 통해 공유

Azure OpenAI 서비스의 새로운 기능

2025년 1월

GPT-4o 실시간 API 2024-12-17

2024년 12월

제한된 액세스를 위해 릴리스된 o1 추론 모델

사용 가능 지역

기본 설정 미세 조정(미리 보기)

저장된 완성 및 증류

GPT-4o 2024-11-20

NEW 데이터 영역 프로비전된 배포 유형

2024년 11월

비전 미세 조정 GA

새로운 AI 남용 모니터링

2024년 10월

NEW 데이터 영역 표준 배포 유형

전역 Batch GA

o1-preview 및 o1-mini 모델 제한된 액세스

음성 및 오디오 공개 미리 보기를 위한 새로운 GPT-4o 실시간 API

전역 일괄 처리 지원 업데이트

2024년 9월

Azure OpenAI Studio UX 업데이트

GPT-4o 2024-08-06 프로비전된 배포

새로운 전역 프로비전된 배포 유형

제한적 액세스가 가능한 새로운 o1-preview 및 o1-mini 모델

o1 시리즈의 주요 기능

모델 유형

제한 사항

안전

가용성

2024년 8월

GPT-4o 2024-08-06 구조화된 출력

GPT-4o 미니 프로비전된 배포

GPT-4o 미세조정(공개 미리 보기)

새로운 미리 보기 API 릴리스

GPT-4o 미니 지역별 가용성

평가 가이드

초기 액세스 플레이그라운드에서 사용할 수 있는 최신 GPT-4o 모델(미리 보기)

이제 글로벌 일괄 처리 배포를 사용할 수 있음

2024년 7월

GPT-4o mini를 이제 미세 조정에 사용할 수 있음

도우미 파일 검색 도구는 이제 청구됨

GPT-4o 미니 모델이 배치 가능

새로운 책임 있는 AI 기본 콘텐츠 필터링 정책

새 GA API 릴리스

GPT-4o의 글로벌 표준 배포에 사용할 수 있는 지역 확장

2024년 6월

사용 중지 날짜 업데이트

미세 조정을 위한 토큰 기반 청구

새로운 지역에서 릴리스된 GPT-4o

도우미에 대한 CMK(고객 관리형 키) 지원

2024년 5월

GPT-4o 프로비전 배포

도우미 v2(미리 보기)

GPT-4o 모델 GA(일반 공급)

글로벌 표준 배포 유형(미리 보기)

미세 조정 업데이트

DALL-E 및 GPT-4 Turbo Vision GA 구성 가능 콘텐츠 필터

모든 Azure OpenAI 고객이 사용할 수 있는 비동기 필터

Prompt Shields

2024-05-01-preview API 릴리스

GPT-4 Turbo 모델 GA(일반 공급)

OpenAI와 Azure OpenAI GPT-4 Turbo GA 모델의 차이점

gpt-4 vision-preview와의 차이점

GPT-4 Turbo 프로비전된 관리 가용성

GPT-4 Turbo with Vision GA 배포

2024년 4월

이제 미국 동부 2와 스위스 서부 두 개의 새로운 지역에서 미세 조정이 지원됩니다.

미국 동부 2

스위스 서부

다단계 채팅 학습 예

GPT-4(0125)는 Azure OpenAI On Your Data에서 사용할 수 있음

2024년 3월

Azure OpenAI 스튜디오의 위험 및 안전 모니터링

Azure OpenAI On Your Data 업데이트

2024-02-01 GA(일반 공급) API 릴리스

Whisper GA(일반 공급)

DALL-E 3 GA(일반 공급)

DALL-E 3에 대한 새로운 지역 지원

모델 사용 중단 및 사용 중지