Модели Службы Azure OpenAI

Статья
02/19/2025

Служба Azure OpenAI работает на платформе разнообразного набора моделей с разными возможностями и ценовыми категориями. Доступность модели зависит от региона и облака. Сведения о доступности модели Azure для государственных организаций см. в Azure для государственных организаций службе OpenAI.

Модели	Description
модели o-серии	Модели рассуждений с расширенным решением проблем и повышением фокуса и возможностей.
GPT-4o & GPT-4o mini & GPT-4 Turbo	Последние модели Azure OpenAI с многомодальными версиями, которые могут принимать как текст, так и изображения в качестве входных данных.
Звук GPT-4o	Звуковые модели GPT-4o, поддерживающие низкую задержку, "речь в речи", взаимодействие с беседами или создание звука.
GPT-4	Набор моделей, которые улучшают GPT-3.5 и могут понимать и создавать естественный язык и код.
GPT-3.5	Набор моделей, которые улучшают GPT-3 и могут понимать и создавать естественный язык и код.
Внедрение	Набор моделей, способных преобразовывать текст в числовую векторную форму для обеспечения сходства текстов.
DALL-E	Серия моделей, которые могут создавать исходные изображения на естественном языке.
Шептать	Серия моделей в предварительной версии, которая может транскрибировать и переводить речь в текст.
Текст для речи (предварительная версия)	Серия моделей в предварительной версии, которая может синтезировать текст для речи.

модели o-серии

Модели серии Azure OpenAI^* специально предназначены для решения задач по устранению причин и решению проблем с повышенным фокусом и возможностями. Эти модели тратят больше времени на обработку и понимание запроса пользователя, что делает их исключительно сильными в таких областях, как наука, программирование и математика по сравнению с предыдущими итерациями.

Model ID	Description	Максимальный запрос (токены)	Учебные данные (до)
`o3-mini` (2025-01-31)	Последняя модель рассуждений, предлагающая расширенные возможности аргументирования. — структурированные выходные данные — обработка только для текста — Функции и инструменты Запрос доступа: приложение модели ограниченного доступа	Входные данные: 200 000 Выходные данные: 100 000	Октябрь 2023 г.
`o1` (2024-12-17)	Наиболее способная модель в серии o1, предлагающая расширенные возможности рассуждений. — структурированные выходные данные — Текст, обработка изображений — Функции и инструменты Запрос доступа: приложение модели ограниченного доступа	Входные данные: 200 000 Выходные данные: 100 000	Октябрь 2023 г.
`o1-preview` (2024-09-12)	Более ранняя предварительная версия	Входные данные: 128 000 Выходные данные: 32 768	Октябрь 2023 г.
`o1-mini` (2024-09-12)	Более быстрый и более экономичный вариант в серии o1 идеально подходит для задач программирования, требующих скорости и снижения потребления ресурсов. Глобальное стандартное развертывание, доступное по умолчанию. В настоящее время развертывания уровня "Стандартный" (региональные) доступны только для тех клиентов, которые получили доступ в рамках выпуска ограниченного `o1-preview` доступа.	Входные данные: 128 000 Выходные данные: 65 536	Октябрь 2023 г.

Availability

Для доступа к o3-mini и o1 регистрации требуется, и доступ будет предоставлен на основе критериев соответствия корпорации Майкрософт. Клиенты, которые ранее применили и получили доступ к o1-preview, или o1 не нужно повторно применять, так как они автоматически находятся в списке ожидания для последних моделей в серии o.

Запрос доступа: приложение модели ограниченного доступа

После предоставления доступа необходимо создать развертывание для каждой модели.

Дополнительные сведения о расширенных o-series моделях см . в статье о начале работы с моделями причин.

Доступность по регионам

Модель	Область/регион
`o3-mini`	См. таблицу моделей.
`o1`	См. таблицу моделей.
`o1-preview`	См. таблицу моделей. Эта модель доступна только для клиентов, которым предоставлен доступ в рамках исходного ограниченного доступа.
`o1-mini`	См. таблицу моделей.

Звук GPT-4o

Звуковые модели GPT 4o являются частью семейства моделей GPT-4o и поддерживают низкую задержку, "речь в, речь вне" диалоговых взаимодействий или создание звука.

Звук GPT-4o в режиме реального времени предназначен для обработки взаимодействия бесед с низкой задержкой в режиме реального времени, что делает его отличным для агентов поддержки, помощников, переводчиков и других вариантов использования, которые нуждаются в высокой скорости реагирования обратно и вперед с пользователем. Дополнительные сведения об использовании звука GPT-4o в режиме реального времени см. в кратком руководстве по звуку GPT-4o в режиме реального времени и использовании звука GPT-4o.
Завершение звука GPT-4o предназначено для создания звука из звуковых или текстовых запросов, что делает его отличным подходом для создания аудиокниг, аудиоконтента и других вариантов использования, требующих создания звука. Модель завершения звука GPT-4o представляет модальность звука в существующий /chat/completions API. Дополнительные сведения об использовании завершения звука GPT-4o см. в кратком руководстве по созданию звука.

Чтобы использовать звук GPT-4o, требуется ресурс Azure OpenAI в одном из поддерживаемых регионов.

При создании ресурса можно развернуть звуковую модель GPT-4o.

Сведения о максимальных маркерах запроса и обучающих данных доступны в следующей таблице.

Model ID	Description	Максимальный запрос (токены)	Учебные данные (до)
`gpt-4o-mini-audio-preview` (2024-12-17) Звук GPT-4o	Звуковая модель для создания звука и текста.	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.
`gpt-4o-mini-realtime-preview` (2024-12-17) Звук GPT-4o	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.
`gpt-4o-audio-preview` (2024-12-17) Звук GPT-4o	Звуковая модель для создания звука и текста.	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.
`gpt-4o-realtime-preview` (2024-12-17) Звук GPT-4o	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.
`gpt-4o-realtime-preview` (2024-10-01) Звук GPT-4o	Звуковая модель для обработки звука в режиме реального времени.	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.

Доступность по регионам

Модель	Область/регион
`gpt-4o-mini-audio-preview`	Восточная часть США2 (глобальный стандарт)
`gpt-4o-mini-realtime-preview`	Восточная часть США2 (глобальный стандарт) Центральная Швеция (глобальный стандарт)
`gpt-4o-audio-preview`	Восточная часть США2 (глобальный стандарт) Центральная Швеция (глобальный стандарт)
`gpt-4o-realtime-preview`	Восточная часть США2 (глобальный стандарт) Центральная Швеция (глобальный стандарт)

Чтобы сравнить доступность звуковых моделей GPT-4o во всех регионах, см. таблицу моделей.

GPT-4o и GPT-4 Turbo

GPT-4o интегрирует текст и изображения в одну модель, что позволяет одновременно обрабатывать несколько типов данных. Этот многомодальный подход повышает точность и скорость реагирования на взаимодействие с компьютером. GPT-4o соответствует GPT-4 Turbo в английском тексте и задачах программирования, обеспечивая более высокую производительность на языках, отличных от английского языка и задач визуального зрения, устанавливая новые тесты для возможностей искусственного интеллекта.

Разделы справки доступ к моделям GPT-4o и GPT-4o mini?

GPT-4o и GPT-4o mini доступны для стандартного и глобального развертывания модели.

Необходимо создать или использовать существующий ресурс в поддерживаемом стандартном или глобальном стандартном регионе, где доступна модель.

При создании ресурса можно развернуть модели GPT-4o. Если выполняется программное развертывание, имена моделей :

gpt-4o Версия2024-11-20
gpt-4o Версия2024-08-06
gpt-4o Версия2024-05-13
gpt-4o-mini Версия2024-07-18

GPT-4 Turbo

GPT-4 Turbo — это большая многомодальная модель (прием ввода текста или изображения и создание текста), которая может решить сложные проблемы с большей точностью, чем любая из предыдущих моделей OpenAI. Как и GPT-3.5 Turbo, и более старые модели GPT-4 GPT-4 Turbo оптимизированы для чата и хорошо работают для традиционных задач завершения.

Последний выпуск GPT-4 Turbo:

gpt-4 Версия:turbo-2024-04-09

Это замена для следующих моделей предварительной версии:

gpt-4 Версия:1106-Preview
gpt-4 Версия:0125-Preview
gpt-4 Версия:vision-preview

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

Версия OpenAI последней 0409 модели turbo поддерживает режим JSON и функцию, вызывая для всех запросов вывода.
Версия Azure OpenAI последней turbo-2024-04-09 в настоящее время не поддерживает использование режима JSON и вызова функций при выполнении запросов вывода с входными данными изображения (визуального зрения). Текстовые входные запросы (запросы без image_url встроенных изображений) поддерживают режим JSON и вызов функции.

Различия от gpt-4 vision-preview

Интеграция СИИ с GPT-4 Turbo с Vision не поддерживается для gpt-4версии:turbo-2024-04-09 К ним относятся оптическое распознавание символов (OCR), заземление объектов, запросы видео и улучшенная обработка данных с помощью изображений.

Внимание

Улучшения визуального распознавания предварительных версий, включая оптическое распознавание символов (OCR), заземление объектов, запросы видео больше не будут доступны после gpt-4 обновления turbo-2024-04-09версииvision-preview. Если вы используете какие-либо из этих предварительных версий функций, это автоматическое обновление модели будет критическим изменением.

GPT-4 Turbo подготовленная управляемая доступность

gpt-4 Версия:turbo-2024-04-09 доступен как для стандартных, так и подготовленных развертываний. В настоящее время подготовленная версия этой модели не поддерживает запросы на вывод изображений и визуального зрения. Подготовленные развертывания этой модели принимают только текстовые входные данные. Развертывания стандартной модели принимают как текстовые, так и запросы вывода изображений и визуального распознавания.

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

Чтобы развернуть модель общедоступной версии на портале Azure AI Foundry, выберите GPT-4 и выберите turbo-2024-04-09 версию из раскрывающегося меню. Квота по умолчанию для gpt-4-turbo-2024-04-09 модели будет совпадать с текущей квотой для GPT-4-Turbo. См. ограничения региональной квоты.

GPT-4

GPT-4 является предшественником GPT-4 Turbo. Обе модели GPT-4 и GPT-4 Turbo имеют базовое имя gpt-4модели. Вы можете различать модели GPT-4 и Turbo, изучая версию модели.

gpt-4 Версия0314
gpt-4 Версия0613
gpt-4-32k Версия0613

Вы можете увидеть длину контекста маркера, поддерживаемую каждой моделью в сводной таблице модели.

Модели GPT-4 и GPT-4 Turbo

Эти модели можно использовать только с API завершения чата.

Ознакомьтесь с версиями моделей, чтобы узнать, как Служба Azure OpenAI обрабатывает обновления версий модели и работает с моделями , чтобы узнать, как просматривать и настраивать параметры версии модели развертываний GPT-4.

Model ID	Description	Максимальный запрос (токены)	Учебные данные (до)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	Последняя модель большой общедоступной версии — структурированные выходные данные — Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения. - Улучшенная возможность творческого письма	Входные данные: 128 000 Выходные данные: 16 384	Октябрь 2023 г.
`gpt-4o` (2024-08-06) GPT-4o (Omni)	— структурированные выходные данные — Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения	Входные данные: 128 000 Выходные данные: 16 384	Октябрь 2023 г.
`gpt-4o-mini` (2024-07-18) GPT-4o mini	Последняя модель небольшой общедоступной версии — Быстрая, недорогая модель с поддержкой идеально подходит для замены моделей серии GPT-3.5 Turbo. — Текст, обработка изображений — режим JSON — параллельные вызовы функций	Входные данные: 128 000 Выходные данные: 16 384	Октябрь 2023 г.
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Текст, обработка изображений — режим JSON — параллельные вызовы функций — улучшенная точность и скорость реагирования — Четность с английским текстом и задачами кодирования по сравнению с GPT-4 Turbo с vision — высокая производительность на языках, отличных от английского языка, и в задачах визуального зрения	Входные данные: 128 000 Выходные данные: 4096	Октябрь 2023 г.
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo с vision	Новая модель общедоступной версии — замена всех предыдущих моделей`vision-preview` GPT-4 (, `1106-Preview`, `0125-Preview`). - Доступность компонентов в настоящее время отличается в зависимости от метода ввода и типа развертывания.	Входные данные: 128 000 Выходные данные: 4096	Декабрь 2023 г.
`gpt-4` (0125-Preview)* GPT-4 Turbo Preview	Предварительная версия модели -Заменяет 1106-Preview — повышение производительности создания кода — уменьшает случаи, когда модель не завершает задачу — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия)	Входные данные: 128 000 Выходные данные: 4096	Декабрь 2023 г.
`gpt-4` (визуально-предварительная версия) GPT-4 Turbo с предварительным просмотром визуального зрения	Предварительная версия модели — принимает входные данные текста и изображения. — поддерживает улучшения — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия)	Входные данные: 128 000 Выходные данные: 4096	Апрель 2023 г.
`gpt-4` (1106-preview) GPT-4 Turbo Preview	Предварительная версия модели — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия)	Входные данные: 128 000 Выходные данные: 4096	Апрель 2023 г.
`gpt-4-32k` (0613)	Старая модель общедоступной версии — Базовый вызов функции с инструментами	32,768	Сентябрь 2021 г.
`gpt-4` (0613)	Старая модель общедоступной версии — Базовый вызов функции с инструментами	8,192	Сентябрь 2021 г.
`gpt-4-32k`(0314)	Старая модель общедоступной версии - Сведения о прекращении поддержки	32,768	Сентябрь 2021 г.
`gpt-4` (0314)	Старая модель общедоступной версии - Сведения о прекращении поддержки	8,192	Сентябрь 2021 г.

Внимание

Мы не рекомендуем использовать предварительные версии моделей в рабочей среде. Мы обновим все развертывания моделей предварительной версии до будущих версий предварительной версии или до последней стабильной общедоступной версии. Модели, назначенные предварительной версией, не соответствуют стандартному жизненному циклу модели Azure OpenAI.

GPT-4 версии 0125-preview — это обновленная версия предварительной версии GPT-4 Turbo, выпущенная ранее в качестве версии 1106-preview.
GPT-4 версии 0125-preview завершает такие задачи, как создание кода более полно по сравнению с gpt-4-1106-preview. Из-за этого в зависимости от задачи клиенты могут обнаружить, что GPT-4-0125-preview создает больше выходных данных по сравнению с gpt-4-1106-preview. Мы рекомендуем клиентам сравнивать выходные данные новой модели. GPT-4-0125-preview также устраняет ошибки в gpt-4-1106-preview с обработкой UTF-8 для языков, отличных от английского языка.
GPT-4 — это последняя версия общедоступной версии turbo-2024-04-09 и заменяет , 1106-previewа vision-previewтакже 0125-Preview.

GPT-3.5

Модели GPT-3.5 могут понять и создать естественный язык или код. Наиболее эффективной и экономичной моделью в семействе GPT-3.5 является GPT-3.5 Turbo, которая оптимизирована для чата и хорошо работает для традиционных задач завершения, а также. GPT-3.5 Turbo доступен для использования с API завершения чата. Служба GPT-3.5 Turbo Instruct имеет аналогичные возможности использования text-davinci-003 API завершения вместо API завершения чата. Мы рекомендуем использовать GPT-3.5 Turbo и GPT-3.5 Turbo Instruct над устаревшими моделями GPT-3.5 и GPT-3.

Model ID	Description	Максимальный запрос (токены)	Учебные данные (до)
`gpt-35-turbo` (0125) NEW	Последняя модель общедоступной версии — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия) — более высокая точность при реагировании в запрошенных форматах. — Исправлена ошибка, из-за которой возникла проблема с кодировкой текста для вызовов функций, отличных от английского языка.	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.
`gpt-35-turbo` (1106)	Старая модель общедоступной версии — режим JSON — параллельные вызовы функций — воспроизводимые выходные данные (предварительная версия)	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.
`gpt-35-turbo-instruct` (0914)	Только конечная точка завершения — замена устаревших моделей завершения	4,097	Сентябрь 2021 г.
`gpt-35-turbo-16k` (0613)	Старая модель общедоступной версии — Базовый вызов функции с инструментами	16,384	Сентябрь 2021 г.
`gpt-35-turbo` (0613)	Старая модель общедоступной версии — Базовый вызов функции с инструментами	4096	Сентябрь 2021 г.
`gpt-35-turbo` ¹ (0301)	Старая модель общедоступной версии - Сведения о прекращении поддержки	4096	Сентябрь 2021 г.

Дополнительные сведения о взаимодействии с GPT-3.5 Turbo и API завершения чата см . в подробном руководстве.

¹ Эта модель будет принимать запросы > 4096 токенов. Не рекомендуется превышать ограничение на 4096 входных маркеров, так как более новая версия модели ограничена 4096 токенами. Если возникают проблемы при превышении 4096 входных маркеров с этой моделью, эта конфигурация официально не поддерживается.

Внедрение

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Для перехода от использования text-embedding-ada-002text-embedding-3-large к вам потребуется создать новые внедрения.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

При тестировании OpenAI сообщает как о больших, так и небольших моделях внедрения третьего поколения, что обеспечивает более высокую производительность многоязычного извлечения с помощью теста MIRACL , сохраняя производительность для английских задач с помощью теста MTEB .

Тест оценки	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Среднее значение MIRACL	31,4	44.0	54.9
Среднее значение MTEB	61,0	62,3	64.6

Модели внедрения третьего поколения поддерживают уменьшение размера внедрения с помощью нового dimensions параметра. Как правило, более крупные внедрения являются более дорогими с точки зрения вычислений, памяти и хранилища. Возможность настроить количество измерений позволяет более контролировать общую стоимость и производительность. Параметр dimensions не поддерживается во всех версиях библиотеки Python OpenAI 1.x, чтобы воспользоваться этим параметром, рекомендуется обновить до последней версии: pip install openai --upgrade

Тестирование тестов mtEB в OpenAI показало, что даже если размеры модели третьего поколения снижаются до менее text-embeddings-ada-002 1536 измерений производительности, остается немного лучше.

DALL-E

Модели DALL-E создают изображения из текстовых запросов, которые предоставляет пользователь. DALL-E 3 обычно доступен для использования с ИНТЕРФЕЙСами REST API. DALL-E 2 и DALL-E 3 с клиентскими пакетами SDK находятся в предварительной версии.

Шептать

Модели Whisper можно использовать для преобразования речи в текст.

Вы также можете использовать модель Whisper с помощью API пакетной транскрибирования службы распознавания речи Azure. Ознакомьтесь с тем, что такое модель Whisper? Чтобы узнать больше об использовании службы "Речь ИИ Azure" и "Служба OpenAI Azure".

Текст для речи (предварительная версия)

Текст OpenAI для моделей речи, в настоящее время в предварительной версии, можно использовать для синтеза текста для речи.

Вы также можете использовать текст OpenAI для речевых голосов с помощью службы "Речь ИИ Azure". Дополнительные сведения см. в статье OpenAI text to speech voices via Azure OpenAI Service or via Azure AI Speech guide.

Сводная таблица модели и доступность региона

Модели по типу развертывания

Azure OpenAI предоставляет клиентам выбор в структуре размещения, которая соответствует своим бизнес-шаблонам и шаблонам использования. Служба предлагает два основных типа развертывания:

Стандарт предлагается с глобальным вариантом развертывания, маршрутизация трафика глобально для обеспечения более высокой пропускной способности.
Подготовка также предоставляется с помощью глобального варианта развертывания, что позволяет клиентам приобретать и развертывать подготовленные единицы пропускной способности в глобальной инфраструктуре Azure.

Все развертывания могут выполнять те же операции вывода, однако выставление счетов, масштабирование и производительность существенно отличаются. Дополнительные сведения о типах развертывания Azure OpenAI см. в руководстве по типам развертывания.

Доступность глобальной стандартной модели

Регион	o3-mini, 2025-01-31	o1, 2024-12-17	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o, 2024-11-20	gpt-4o-mini, 2024-07-18	gpt-4o-realtime-preview, 2024-12-17	gpt-4o-realtime-preview, 2024-10-01	gpt-4o-audio-preview, 2024-12-17	gpt-4o-mini-realtime-preview, 2024-12-17	gpt-4o-mini-audio-preview, 2024-12-17	gpt-4, turbo-2024-04-09
australiaeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
brazilsouth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
canadaeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
eastus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
germanywestcentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
japaneast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
koreacentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
northcentralus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
norwayeast	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
польшацентральная	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
southafricanorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
southcentralus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
southindia	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
spaincentral	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅
switzerlandnorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
uaenorth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
uksouth	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
westeurope	-	-	-	-	✅	✅	-	✅	-	-	-	-	-	✅
westus	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅
westus3	-	-	✅	✅	✅	✅	✅	✅	-	-	-	-	-	✅

Примечание.

Большинство моделей серии O ограничены доступом. Запрос доступа: приложение модели ограниченного доступа. o1-mini в настоящее время доступен всем клиентам для глобального стандартного развертывания.

Выбор клиентов был предоставлен стандартный (региональный) доступ к o1-mini развертыванию в рамках выпуска ограниченного o1-preview доступа. В настоящее время доступ к стандартным o1-mini (региональным) развертываниям не расширяется.

Доступность глобально подготовленной управляемой модели

Регион	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o, 2024-11-20	gpt-4o-mini, 2024-07-18
australiaeast	✅	✅	✅	✅
brazilsouth	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
germanywestcentral	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅
польшацентральная	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
southeastasia	✅	✅	✅	✅
southindia	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅
switzerlandwest	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Доступность глобальной пакетной модели

Регион	o3-mini, 2025-01-31	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o, 2024-11-20	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, turbo-2024-04-09	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
germanywestcentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
польшацентральная	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
southindia	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Доступность стандартной модели зоны данных

Регион	o3-mini, 2025-01-31	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	-	✅	✅	✅
germanywestcentral	-	✅	✅	✅
northcentralus	✅	✅	✅	✅
польшацентральная	-	✅	✅	✅
southcentralus	✅	✅	✅	✅
spaincentral	-	✅	✅	✅
swedencentral	-	✅	✅	✅
westeurope	-	✅	✅	✅
westus	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Примечание.

Доступность управляемой модели с подготовленной зоной данных

Регион	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
польшацентральная	✅	✅	✅
southcentralus	✅	✅	✅
spaincentral	✅	✅	✅
swedencentral	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Доступность пакетной модели зоны данных

Регион	o3-mini, 2025-01-31	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	-	✅	✅
germanywestcentral	-	✅	✅
northcentralus	✅	✅	✅
польшацентральная	-	✅	✅
southcentralus	✅	✅	✅
swedencentral	-	✅	✅
westeurope	-	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Доступность модели развертывания уровня "Стандартный"

Регион	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613	gpt-35-turbo-instruct, 0914	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2	dall-e-3, 3.0	tts, 001	tts-hd, 001	шепет, 001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	✅	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	✅
польшацентральная	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	-	-	-	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	✅	✅	✅	-	✅	-	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	✅	-	-	✅	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-

Примечание.

Доступность подготовленной модели развертывания

Регион	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	✅	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	✅	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	-	✅	-	✅	-	-
польшацентральная	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
southcentralus	✅	✅	-	✅	✅	✅	✅	✅	✅	✅
southeastasia	-	✅	✅	-	-	-	-	-	-	-
southindia	✅	✅	✅	✅	✅	✅	-	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandwest	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	✅	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Примечание.

Подготовленная версия версии gpt-4:turbo-2024-04-09 в настоящее время ограничена только текстом.

Дополнительные сведения о подготовленных развертываниях см. в нашем руководстве по подготовке.

Эта таблица не содержит сведения о точной настройке региональной доступности. Ознакомьтесь с разделом по настройке этих сведений.

Стандартные модели по конечной точке

Завершение чата

Регион	o1-preview, 2024-09-12	o1-mini, 2024-09-12	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, vision-preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0301	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southcentralus	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

Примечание.

Доступность модели GPT-4 и GPT-4 Turbo

Выбор доступа к клиенту

Помимо указанных выше регионов, доступных всем клиентам Azure OpenAI, некоторые из них получили доступ к версиям GPT-4 в дополнительных регионах:

Модель	Область/регион
`gpt-4` (0314) `gpt-4-32k` (0314)	Восточная часть США Центральная Франция Южная часть США южная часть Соединенного Королевства
`gpt-4` (0613) `gpt-4-32k` (0613)	Восточная часть США Восточная часть США 2 Восточная Япония южная часть Соединенного Королевства

Модели GPT-3.5

Модели Embeddings

Регион	text-embedding-3-small, 1	text-embedding-3-large, 1	text-embedding-ada-002, 1	text-embedding-ada-002, 2
australiaeast	✅	✅	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
польшацентральная	-	✅	-	-
southafricanorth	-	-	-	✅
southcentralus	-	-	✅	✅
southindia	-	✅	-	✅
swedencentral	-	✅	-	✅
switzerlandnorth	✅	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	✅	-	-	✅
westus3	-	✅	-	✅

Эти модели можно использовать только с запросами API внедрения.

Примечание.

text-embedding-3-large является последней и самой способной моделью внедрения. Обновление между моделями внедрения невозможно. Чтобы перейти от использования text-embedding-ada-002text-embedding-3-large к вам, потребуется создать новые внедрения.

Model ID	Максимальный запрос (токены)	Измерения выходных данных	Учебные данные (до)
`text-embedding-ada-002` (версия 2)	8,192	1536	Сентябрь 2021 г.
`text-embedding-ada-002` (версия 1)	2,046	1536	Сентябрь 2021 г.
`text-embedding-3-large`	8,192	3072	Сентябрь 2021 г.
`text-embedding-3-small`	8,192	1536	Сентябрь 2021 г.

Примечание.

При отправке массива входных данных для внедрения максимальное количество входных элементов в массиве на вызов конечной точки внедрения составляет 2048.

Модели создания изображений

Регион	dall-e-3, 3.0
australiaeast	✅
eastus	✅
swedencentral	✅

Модели DALL-E

Model ID	Максимальный запрос (символы)
dall-e-3	4000

Звуковые модели

Регион	tts, 001	tts-hd, 001	шепет, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
swedencentral	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Модели Whisper

Model ID	Максимальный запрос (размер аудиофайла)
`whisper`	25 Мб

Модели преобразования текста в речь (предварительная версия)

Model ID	Description
`tts`	Последняя версия модели преобразования текста в речь в Azure OpenAI, оптимизированная для скорости.
`tts-hd`	Последняя модель текста Azure OpenAI для речи, оптимизированная для качества.

Регион	gpt-35-turbo-instruct, 0914
eastus	✅
swedencentral	✅

Модели точной настройки

Примечание.

gpt-35-turbo — Настройка этой модели ограничена подмножеством регионов и недоступна в каждом регионе, где доступна базовая модель.

Поддерживаемые регионы для точной настройки могут отличаться, если вы используете модели Azure OpenAI в проекте Azure AI Foundry и вне проекта.

Model ID	Точное настройка регионов	Максимальный запрос (токены)	Учебные данные (до)
`gpt-35-turbo` (0613)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	4096	Сентябрь 2021 г.
`gpt-35-turbo` (1106)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	Входные данные: 16 385 Выходные данные: 4096	Сентябрь 2021 г.
`gpt-35-turbo` (0125)	Восточная часть США2 Северная часть США Центральная Швеция Западная Швейцария	16,385	Сентябрь 2021 г.
`gpt-4` (0613) ¹	Северная часть США Центральная Швеция	8192	Сентябрь 2021 г.
`gpt-4o-mini` (2024-07-18)	Северная часть США Центральная Швеция	Входные данные: 128 000 Выходные данные: 16 384 Длина контекста примера обучения: 64 536	Октябрь 2023 г.
`gpt-4o` (2024-08-06)	Восточная часть США2 Северная часть США Центральная Швеция	Входные данные: 128 000 Выходные данные: 16 384 Длина контекста примера обучения: 64 536	Октябрь 2023 г.

¹ GPT-4 в настоящее время находится в общедоступной предварительной версии.

Помощники (предварительная версия)

Для Помощников требуется сочетание поддерживаемой модели и поддерживаемого региона. Для некоторых инструментов и возможностей требуются последние модели. Следующие модели доступны в API Помощников, пакете SDK и Azure AI Foundry. Следующая таблица предназначена для оплаты по мере использования. Сведения о доступности подготовленной единицы пропускной способности (PTU) см . в статье о подготовленной пропускной способности. Перечисленные модели и регионы можно использовать как с помощниками версии 1, так и с версией 2. Вы можете использовать глобальные стандартные модели , если они поддерживаются в перечисленных ниже регионах.

Регион	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Preview	gpt-4, 0125-Preview	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	✅	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Прекращение использования модели

Последние сведения о выходе на пенсию модели см. в руководстве по выходу на пенсию модели.

Поделиться через

Модели Службы Azure OpenAI

модели o-серии

Availability

Доступность по регионам

Звук GPT-4o

Доступность по регионам

GPT-4o и GPT-4 Turbo

Разделы справки доступ к моделям GPT-4o и GPT-4o mini?

GPT-4 Turbo

Различия между моделями OpenAI и Azure OpenAI GPT-4 Turbo GA

Различия от gpt-4 vision-preview

GPT-4 Turbo подготовленная управляемая доступность

Развертывание GPT-4 Turbo с помощью общедоступной версии vision

GPT-4

Модели GPT-4 и GPT-4 Turbo

GPT-3.5

Внедрение

DALL-E

Шептать

Текст для речи (предварительная версия)

Сводная таблица модели и доступность региона

Модели по типу развертывания

Доступность глобальной стандартной модели

Стандартные модели по конечной точке

Завершение чата

Доступность модели GPT-4 и GPT-4 Turbo

Выбор доступа к клиенту

Модели GPT-3.5

Модели точной настройки

Помощники (предварительная версия)

Прекращение использования модели

Следующие шаги

Обратная связь

Дополнительные ресурсы