Modelos Azure OpenAI Service

Artigo
01/08/2025

O Azure OpenAI Service tem a tecnologia diversificada de um conjunto de modelos com diferentes capacidades e níveis de preços. A disponibilidade do modelo varia de acordo com a região e a nuvem. Para obter a disponibilidade do modelo do Azure Government, consulte Azure Government OpenAI Service.

Modelos	Description
o1 & o1-mini	Modelos de acesso limitado, especificamente concebidos para lidar com tarefas de raciocínio e resolução de problemas com maior foco e capacidade.
GPT-4o & GPT-4o mini & GPT-4 Turbo	Os modelos mais recentes e capazes do Azure OpenAI com versões multimodais, que podem aceitar texto e imagens como entrada.
GPT-4o-Pré-visualização em tempo real	Um modelo GPT-4o que suporta interações conversacionais de baixa latência, "speech in, speech out".
GPT-4	Um conjunto de modelos que melhoram o GPT-3.5 e podem compreender e gerar linguagem natural e código.
GPT-3,5	Um conjunto de modelos que melhoram o GPT-3 e podem compreender e gerar linguagem natural e código.
Incorporações	Um conjunto de modelos que podem converter texto em forma vetorial numérica para facilitar a semelhança de texto.
DALL-E	Uma série de modelos que podem gerar imagens originais a partir de linguagem natural.
Sussurro	Uma série de modelos em pré-visualização que podem transcrever e traduzir fala em texto.
Conversão de texto em fala (Pré-visualização)	Uma série de modelos em pré-visualização que podem sintetizar texto em voz.

Modelos O1 e O1-mini de acesso limitado

O Azure OpenAI o1 e o1-mini os modelos são projetados especificamente para lidar com tarefas de raciocínio e resolução de problemas com maior foco e capacidade. Esses modelos gastam mais tempo processando e entendendo a solicitação do usuário, tornando-os excepcionalmente fortes em áreas como ciência, codificação e matemática em comparação com iterações anteriores.

Model ID	Description	Solicitação máxima (tokens)	Dados de formação (até)
`o1` (2024-12-17)	O modelo mais capaz da série o1, oferecendo capacidades de raciocínio melhoradas. - Resultados estruturados - Texto, processamento de imagem - Funções/Ferramentas Solicitar acesso: aplicativo modelo de acesso limitado	Entrada: 200.000 Saída: 100.000	Outubro de 2023
`o1-preview` (2024-09-12)	Versão de pré-visualização mais antiga	Entrada: 128.000 Potência: 32.768	Outubro de 2023
`o1-mini` (2024-09-12)	Uma opção mais rápida e económica na série o1, ideal para tarefas de codificação que exigem velocidade e menor consumo de recursos.	Entrada: 128.000 Saída: 65.536	Outubro de 2023

Disponibilidade

Os o1 modelos e o1-mini agora estão disponíveis para acesso à API e implantação de modelos. O registro é necessário e o acesso será concedido com base nos critérios de elegibilidade da Microsoft. Os clientes que se inscreveram anteriormente e receberam acesso ao o1-preview, não precisam se recandidatar, pois estão automaticamente na lista de espera para o modelo mais recente.

Solicitar acesso: aplicativo modelo de acesso limitado

Depois que o acesso for concedido, você precisará criar uma implantação para cada modelo. Se você tiver uma atualização de implantação existente o1-preview no local não for suportada no momento, será necessário criar uma nova implantação.

Para saber mais sobre os modelos avançados o1 da série, consulte Introdução aos modelos de raciocínio da série o1.

Disponibilidade da região

Modelo	País/Região
`o1`	Leste US2 (Padrão Global) Suécia Central (Norma Global)
`o1-preview`	Consulte a tabela de modelos.
`o1-mini`	Consulte a tabela de modelos.

GPT-4o-Pré-visualização em tempo real

Os modelos de áudio GPT 4o fazem parte da família de modelos GPT-4o e suportam interações conversacionais de baixa latência, "speech in, speech out". O áudio GPT-4o foi projetado para lidar com interações conversacionais em tempo real e de baixa latência, tornando-se uma ótima opção para agentes de suporte, assistentes, tradutores e outros casos de uso que precisam de idas e vindas altamente responsivas com um usuário.

O áudio GPT-4o está disponível nas regiões Leste dos EUA 2 (eastus2) e Suécia Central (swedencentral). Para usar o áudio GPT-4o, você precisa criar ou usar um recurso existente em uma das regiões suportadas.

Quando o recurso é criado, você pode implantar o modelo de áudio GPT-4o. Para obter mais informações sobre como usar o áudio GPT-4o, consulte o início rápido do áudio GPT-4o e como usar o áudio GPT-4o.

Detalhes sobre tokens de solicitação máxima e dados de treinamento estão disponíveis na tabela a seguir.

Model ID	Description	Solicitação máxima (tokens)	Dados de formação (até)
`gpt-4o-realtime-preview` (2024-10-01) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real	Entrada: 128.000 Saída: 4.096	Outubro de 2023
`gpt-4o-realtime-preview` (2024-12-17) Áudio GPT-4o	Modelo de áudio para processamento de áudio em tempo real	Entrada: 128.000 Saída: 4.096	Outubro de 2023

GPT-4o e GPT-4 Turbo

O GPT-4o integra texto e imagens em um único modelo, permitindo lidar com vários tipos de dados simultaneamente. Esta abordagem multimodal aumenta a precisão e a capacidade de resposta nas interações homem-computador. O GPT-4o combina com o GPT-4 Turbo em tarefas de texto e codificação em inglês, oferecendo desempenho superior em idiomas diferentes do inglês e tarefas de visão, estabelecendo novos padrões para os recursos de IA.

Como faço para acessar os modelos GPT-4o e GPT-4o mini?

GPT-4o e GPT-4o mini estão disponíveis para implantação de modelos padrão e global.

Você precisa criar ou usar um recurso existente em uma região padrão ou padrão global suportada onde o modelo está disponível.

Quando seu recurso é criado, você pode implantar os modelos GPT-4o. Se você estiver executando uma implantação programática, os nomes dos modelos são:

gpt-4oVersão 2024-11-20
gpt-4oVersão 2024-08-06
gpt-4oVersão 2024-05-13
gpt-4o-miniVersão 2024-07-18

GPT-4 Turbo

GPT-4 Turbo é um grande modelo multimodal (aceitando entradas de texto ou imagem e gerando texto) que pode resolver problemas difíceis com maior precisão do que qualquer um dos modelos anteriores da OpenAI. Como o GPT-3.5 Turbo e os modelos GPT-4 mais antigos, o GPT-4 Turbo é otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais.

A última versão GA do GPT-4 Turbo é:

gpt-4Versão: turbo-2024-04-09

Este é o substituto para os seguintes modelos de pré-visualização:

gpt-4Versão: 1106-Preview
gpt-4Versão: 0125-Preview
gpt-4Versão: vision-preview

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

A versão OpenAI do mais recente 0409 modelo turbo suporta o modo JSON e a função chamando para todas as solicitações de inferência.
A versão mais recente turbo-2024-04-09 do Azure OpenAI atualmente não oferece suporte ao uso do modo JSON e da chamada de função ao fazer solicitações de inferência com entrada de imagem (visão). As solicitações de entrada baseadas em texto (solicitações sem image_url e imagens embutidas) suportam o modo JSON e a chamada de função.

Diferenças do gpt-4 vision-preview

A integração de aprimoramentos de Visão específicos da IA do Azure com o GPT-4 Turbo com Visão não é suportada para gpt-4 a Versão: turbo-2024-04-09. Isso inclui Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo e processamento aprimorado de seus dados com imagens.

Importante

Os recursos de visualização de aprimoramentos de visão, incluindo Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo serão desativados e não estarão mais disponíveis quando gpt-4 Version: vision-preview for atualizado para turbo-2024-04-09. Se você estiver confiando em qualquer um desses recursos de visualização, essa atualização automática do modelo será uma grande mudança.

Disponibilidade gerenciada provisionada GPT-4 Turbo

gpt-4Versão: turbo-2024-04-09 está disponível para implantações padrão e provisionadas. Atualmente, a versão provisionada deste modelo não suporta solicitações de inferência de imagem/visão. As implantações provisionadas desse modelo só aceitam entrada de texto. As implantações de modelo padrão aceitam solicitações de inferência de texto e imagem/visão.

Implantando o GPT-4 Turbo com o Vision GA

Para implantar o modelo GA do portal do Azure AI Foundry, selecione GPT-4 e escolha a turbo-2024-04-09 versão no menu suspenso. A cota padrão para o gpt-4-turbo-2024-04-09 modelo será a mesma cota atual para GPT-4-Turbo. Consulte os limites das quotas regionais.

GPT-4

O GPT-4 é o antecessor do GPT-4 Turbo. Ambos os modelos GPT-4 e GPT-4 Turbo têm um nome de modelo base de gpt-4. Você pode distinguir entre os modelos GPT-4 e Turbo examinando a versão do modelo.

gpt-4Versão 0314
gpt-4Versão 0613
gpt-4-32kVersão 0613

Você pode ver o comprimento do contexto do token suportado por cada modelo na tabela de resumo do modelo.

Modelos GPT-4 e GPT-4 Turbo

Esses modelos só podem ser usados com a API de conclusão de bate-papo.

Consulte as versões do modelo para saber como o Serviço OpenAI do Azure lida com atualizações de versão do modelo e trabalhar com modelos para saber como exibir e configurar as configurações da versão do modelo de suas implantações GPT-4.

Model ID	Description	Solicitação máxima (tokens)	Dados de formação (até)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	O mais recente modelo GA grande - Resultados estruturados - Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em idiomas diferentes do inglês e em tarefas de visão. - Capacidade de escrita criativa melhorada	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o` (2024-08-06) GPT-4o (Omni)	- Resultados estruturados - Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em línguas diferentes do inglês e em tarefas de visão	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini \|	O mais recente modelo GA pequeno - Modelo rápido, barato e capaz, ideal para substituir os modelos da série GPT-3.5 Turbo. - Texto, processamento de imagem - Modo JSON - Chamada de função paralela	Entrada: 128.000 Potência: 16.384	Outubro de 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	Texto, processamento de imagem - Modo JSON - Chamada de função paralela - Maior precisão e capacidade de resposta - Paridade com texto em inglês e tarefas de codificação em comparação com GPT-4 Turbo com Visão - Desempenho superior em línguas diferentes do inglês e em tarefas de visão	Entrada: 128.000 Saída: 4.096	Outubro de 2023
`gpt-4` (turbo-2024-04-09) GPT-4 Turbo com Visão	Novo modelo GA - Substituição de todos os modelos anteriores de pré-visualização GPT-4 (`vision-preview`, `1106-Preview`, `0125-Preview`). - Atualmente, a disponibilidade do recurso é diferente, dependendo do método de entrada e do tipo de implantação.	Entrada: 128.000 Saída: 4.096	Dez 2023
`gpt-4` (0125-Pré-visualização)* GPT-4 Turbo Pré-visualização	Modelo de pré-visualização -Substitui o 1106-Preview - Melhor desempenho de geração de código - Reduz os casos em que o modelo não conclui uma tarefa - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização)	Entrada: 128.000 Saída: 4.096	Dez 2023
`gpt-4` (visão-pré-visualização) GPT-4 Turbo com Vision Preview	Modelo de pré-visualização - Aceita entrada de texto e imagem. - Suporta melhorias - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização)	Entrada: 128.000 Saída: 4.096	Abr 2023
`gpt-4` (1106-Pré-visualização) GPT-4 Turbo Pré-visualização	Modelo de pré-visualização - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização)	Entrada: 128.000 Saída: 4.096	Abr 2023
`gpt-4-32k` (0613)	Modelo GA mais antigo - Chamada de função básica com ferramentas	32,768	Setembro 2021
`gpt-4` (0613)	Modelo GA mais antigo - Chamada de função básica com ferramentas	8,192	Setembro 2021
`gpt-4-32k`(0314)	Modelo GA mais antigo - Informações sobre aposentadoria	32,768	Setembro 2021
`gpt-4` (0314)	Modelo GA mais antigo - Informações sobre aposentadoria	8,192	Setembro 2021

Atenção

Não recomendamos o uso de modelos de visualização em produção. Atualizaremos todas as implantações de modelos de visualização para futuras versões de visualização ou para a versão estável mais recente do GA. Os modelos designados visualização não seguem o ciclo de vida padrão do modelo OpenAI do Azure.

GPT-4 versão 0125-preview é uma versão atualizada do GPT-4 Turbo preview lançado anteriormente como versão 1106-preview.
GPT-4 versão 0125-preview conclui tarefas como a geração de código mais completamente em comparação com gpt-4-1106-preview. Devido a isso, dependendo da tarefa, os clientes podem achar que GPT-4-0125-preview gera mais saída em comparação com o gpt-4-1106-preview. Recomendamos que os clientes comparem as saídas do novo modelo. O GPT-4-0125-preview também resolve bugs no gpt-4-1106-preview com manipulação UTF-8 para idiomas diferentes do inglês.
A versão turbo-2024-04-09 GPT-4 é a versão mais recente do GA e substitui 0125-Preview, 1106-previewe vision-preview.

Importante

As versões 1106-Preview0125-PreviewGPT-4 (gpt-4), e vision-preview serão atualizadas com uma versão estável do gpt-4 no futuro.

As implantações de gpt-4 versões 1106-Preview, 0125-Previewe vision-preview definidas como "Atualização automática para padrão" e "Atualização quando expirar" começarão a ser atualizadas após o lançamento da versão estável. Para cada implantação, uma atualização da versão do modelo ocorre sem interrupção no serviço para chamadas de API. As atualizações são preparadas por região e espera-se que o processo completo de atualização leve 2 semanas.
As implantações de versões 1106-Preview, 0125-Previewe vision-preview definidas como "Sem atualização automática" não serão atualizadas e deixarão de operar quando a versão de gpt-4 visualização for atualizada na região. Consulte Desativações e descontinuações do modelo OpenAI do Azure para obter mais informações sobre o momento da atualização.

GPT-3,5

Os modelos GPT-3.5 podem compreender e gerar linguagem natural ou código. O modelo mais capaz e econômico da família GPT-3.5 é o GPT-3.5 Turbo, que foi otimizado para bate-papo e funciona bem para tarefas de conclusão tradicionais também. O GPT-3.5 Turbo está disponível para uso com a API de Conclusão de Chat. O GPT-3.5 Turbo Instruct tem recursos semelhantes ao text-davinci-003 uso da API de Conclusão em vez da API de Conclusão de Chat. Recomendamos o uso do GPT-3.5 Turbo e GPT-3.5 Turbo Instruct sobre os modelos legados GPT-3.5 e GPT-3.

Model ID	Description	Solicitação máxima (tokens)	Dados de formação (até)
`gpt-35-turbo` (0125) NOVO	Modelo GA mais recente - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização) - Maior precisão na resposta nos formatos solicitados. - Correção de um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.	Entrada: 16.385 Saída: 4.096	Setembro 2021
`gpt-35-turbo` (1106)	Modelo GA mais antigo - Modo JSON - Chamada de função paralela - Produção reprodutível (pré-visualização)	Entrada: 16.385 Saída: 4.096	Setembro 2021
`gpt-35-turbo-instruct` (0914)	Somente ponto final de conclusão - Substituição de modelos de acabamentos legados	4,097	Setembro 2021
`gpt-35-turbo-16k` (0613)	Modelo GA mais antigo - Chamada de função básica com ferramentas	16,384	Setembro 2021
`gpt-35-turbo` (0613)	Modelo GA mais antigo - Chamada de função básica com ferramentas	4,096	Setembro 2021
`gpt-35-turbo` 1 (0301)	Modelo GA mais antigo - Informações sobre aposentadoria	4,096	Setembro 2021

Para saber mais sobre como interagir com o GPT-3.5 Turbo e a API de Conclusão de Chat, confira nosso tutorial detalhado.

1 Este modelo aceitará solicitações > de 4.096 tokens. Não é recomendado exceder o limite de 4.096 tokens de entrada, pois a versão mais recente do modelo está limitada a 4.096 tokens. Se você encontrar problemas ao exceder 4.096 tokens de entrada com este modelo, essa configuração não é oficialmente suportada.

Incorporações

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos incorporados. A fim de passar de usar text-embedding-ada-002 para text-embedding-3-large você precisaria gerar novas incorporações.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Em testes, a OpenAI relata que os modelos de incorporação de terceira geração, grandes e pequenos, oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL enquanto ainda mantêm o desempenho para tarefas em inglês com o benchmark MTEB.

Benchmark de avaliação	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
Média MIRACL	31.4	44.0	54.9
Média MTEB	61,0	62.3	64.6

Os modelos de incorporação de terceira geração suportam a redução do tamanho da incorporação através de um novo dimensions parâmetro. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

O teste de benchmark MTEB da OpenAI descobriu que, mesmo quando as dimensões do modelo de terceira geração são reduzidas para menos de text-embeddings-ada-002 1.536 dimensões, o desempenho permanece ligeiramente melhor.

DALL-E

Os modelos DALL-E geram imagens a partir de prompts de texto fornecidos pelo usuário. O DALL-E 3 está geralmente disponível para uso com as APIs REST. DALL-E 2 e DALL-E 3 com SDKs de cliente estão em visualização.

Sussurro

Os modelos Whisper podem ser usados para conversão de fala em texto.

Você também pode usar o modelo Whisper por meio da API de transcrição em lote do Azure AI Speech. Confira O que é o modelo Whisper?, para saber mais sobre quando usar o Azure AI Speech versus o Azure OpenAI Service.

Conversão de texto em fala (Pré-visualização)

Os modelos de texto para fala do OpenAI, atualmente em visualização, podem ser usados para sintetizar texto para fala.

Você também pode usar o texto OpenAI para falar vozes por meio do Azure AI Speech. Para saber mais, consulte Texto do OpenAI para vozes de fala por meio do Serviço OpenAI do Azure ou do Guia de Fala do Azure AI.

Tabela de resumo do modelo e disponibilidade da região

Modelos por tipo de implantação

O Azure OpenAI oferece aos clientes opções sobre a estrutura de hospedagem que se adapta aos seus padrões de negócios e uso. O serviço oferece dois tipos principais de implantação:

O Standard é oferecido com uma opção de implantação global, roteando o tráfego globalmente para fornecer uma taxa de transferência mais alta.
O provisionado também é oferecido com uma opção de implantação global, permitindo que os clientes comprem e implantem unidades de taxa de transferência provisionadas na infraestrutura global do Azure.

Todas as implantações podem executar exatamente as mesmas operações de inferência, no entanto, o faturamento, a escala e o desempenho são substancialmente diferentes. Para saber mais sobre os tipos de implantação do Azure OpenAI, consulte nosso guia de tipos de implantação.

Disponibilidade do modelo padrão global

Região	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18	gpt-4o-visualização em tempo real, 2024-10-01	gpt-4o-visualização em tempo real, 2024-12-17	GPT-4, turbo-2024-04-09
australiaeast	-	-	✅	✅	-	✅	-	-	✅
brazilsouth	-	-	✅	✅	-	✅	-	-	✅
canadaeast	-	-	✅	✅	-	✅	-	-	✅
eastus	✅	✅	✅	✅	✅	✅	-	-	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	-	-	✅	✅	-	✅	-	-	✅
germanywestcentral	-	-	✅	✅	-	✅	-	-	✅
japaneast	-	-	✅	✅	-	✅	-	-	✅
koreacentral	-	-	✅	✅	-	✅	-	-	✅
northcentralus	✅	✅	✅	✅	✅	✅	-	-	✅
norwayeast	-	-	✅	✅	-	✅	-	-	✅
PolóniaCentral	-	-	✅	✅	-	✅	-	-	✅
southafricanorth	-	-	✅	✅	-	✅	-	-	✅
E.U.A Centro-Sul	✅	✅	✅	✅	✅	✅	-	-	✅
southindia	-	-	✅	✅	-	✅	-	-	✅
EspanhaCentral	-	-	✅	✅	-	✅	-	-	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	✅	✅	-	✅	-	-	✅
uaenorth	-	-	✅	✅	-	✅	-	-	✅
uksouth	-	-	✅	✅	-	✅	-	-	✅
westeurope	-	-	✅	✅	-	✅	-	-	✅
westus	✅	✅	✅	✅	✅	✅	-	-	✅
westus3	✅	✅	✅	✅	✅	✅	-	-	✅

Disponibilidade do modelo gerenciado provisionado global

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18
australiaeast	✅	✅	✅
brazilsouth	✅	✅	✅
canadacentral	✅	✅	✅
canadaeast	✅	✅	✅
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
japaneast	✅	✅	✅
koreacentral	✅	✅	✅
northcentralus	✅	✅	✅
norwayeast	✅	✅	✅
PolóniaCentral	✅	✅	✅
southafricanorth	✅	✅	✅
E.U.A Centro-Sul	✅	✅	✅
southindia	✅	✅	✅
EspanhaCentral	✅	✅	✅
suécia central	✅	✅	✅
norte da suíça	✅	✅	✅
Suíça Oeste	✅	✅	✅
uaenorth	✅	✅	✅
uksouth	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Disponibilidade global do modelo de lote

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O, 2024-11-20	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	GPT-4, turbo-2024-04-09	GPT-35-TURBO, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅
germanywestcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	✅	✅	✅	✅	✅
PolóniaCentral	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅
E.U.A Centro-Sul	✅	✅	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅
norte da suíça	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilidade do modelo padrão da zona de dados

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
PolóniaCentral	✅	✅	✅
E.U.A Centro-Sul	✅	✅	✅
EspanhaCentral	✅	✅	✅
suécia central	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Disponibilidade do modelo gerenciado provisionado de zona de dados

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18
eastus	✅	✅	✅
eastus2	✅	✅	✅
francecentral	✅	✅	✅
germanywestcentral	✅	✅	✅
northcentralus	✅	✅	✅
PolóniaCentral	✅	✅	✅
E.U.A Centro-Sul	✅	✅	✅
EspanhaCentral	✅	✅	✅
suécia central	✅	✅	✅
westeurope	✅	✅	✅
westus	✅	✅	✅
westus3	✅	✅	✅

Disponibilidade do modelo de lote de zona de dados

Região	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18
eastus	✅	✅
eastus2	✅	✅
francecentral	✅	✅
germanywestcentral	✅	✅
E.U.A Centro-Sul	✅	✅
suécia central	✅	✅
westeurope	✅	✅
westus	✅	✅
westus3	✅	✅

Disponibilidade do modelo de implantação padrão

Região	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, visão-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-TURBO, 0301	GPT-35-TURBO, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125	GPT-35-TURBO-16K, 0613	GPT-35-turbo-instrução, 0914	incorporação de texto-3-pequeno, 1	incorporação de texto-3-grande, 1	incorporação de texto-ada-002, 1	incorporação de texto-ada-002, 2	DALL-E-2, 2,0	DALL-E-3, 3,0	Babbage-002, 1	Davinci-002, 1	TTS, 001	TTS-HD, 001	sussurro, 001
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	✅	-	-	-	-	-
brazilsouth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	-
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅	-	-	-	-	✅	-	-	✅	✅	✅	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
PolóniaCentral	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
southafricanorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-
E.U.A Centro-Sul	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-	-	-	-	✅	✅	-	-	-	-	-	-	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅	✅	✅
switzerlandnorth	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅	-	✅	✅	-	✅	-	-	-	-	-	-	✅
uaenorth	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	-	-	-	-	-	-
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-	-	✅	-	-	✅	-	-	-	-	-	-	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-	-	-	✅	-	✅	-	-	-	-	-	-	-

Disponibilidade do modelo de implantação provisionada

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brazilsouth	✅	-	✅	✅	✅	✅	-	✅	✅	-
canadacentral	✅	-	-	✅	-	-	-	✅	-	✅
canadaeast	✅	✅	✅	✅	✅	-	✅	-	✅	-
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	-	✅	-	✅
germanywestcentral	✅	-	-	✅	✅	✅	✅	✅	✅	-
japaneast	✅	✅	✅	-	✅	✅	✅	-	-	✅
koreacentral	✅	✅	✅	✅	-	-	✅	✅	✅	-
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	-	✅	-	✅	-	-
PolóniaCentral	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	-	-	✅	✅	-	✅	✅	✅	-
E.U.A Centro-Sul	✅	-	-	✅	✅	✅	✅	✅	✅	✅
southindia	✅	✅	✅	✅	✅	✅	-	✅	✅	✅
suécia central	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norte da suíça	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Suíça Oeste	-	-	-	-	-	-	-	-	-	✅
uaenorth	✅	✅	-	-	✅	-	-	-	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	-	✅	✅	✅	✅	✅	✅	✅

Nota

A versão provisionada de gpt-4 Version: turbo-2024-04-09 está atualmente limitada apenas ao texto.

Para obter mais informações sobre implantações provisionadas, consulte nossas Diretrizes provisionadas.

Esta tabela não inclui informações de disponibilidade regional de ajuste fino. Consulte a secção de afinação fina para obter estas informações.

Modelos padrão por ponto final

Conclusão do chat

Região	o1-pré-visualização, 2024-09-12	O1-Mini, 2024-09-12	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, visão-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-TURBO, 0301	GPT-35-TURBO, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125	GPT-35-TURBO-16K, 0613
australiaeast	-	-	-	-	-	✅	✅	-	✅	-	✅	-	✅	✅	✅	✅
canadaeast	-	-	-	-	-	✅	✅	-	-	-	✅	-	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	✅	✅	-	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	-	-	✅	-	-	✅	-	✅	✅
francecentral	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	-	✅	-	✅	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	-	-	✅	-	-	-	-	-	-	-	-	-
E.U.A Centro-Sul	✅	✅	✅	✅	✅	-	-	✅	-	✅	-	✅	-	-	✅	-
southindia	-	-	-	-	-	-	✅	-	-	-	-	-	-	✅	✅	-
suécia central	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	-	✅	✅	-	✅
norte da suíça	-	-	-	-	-	✅	-	-	✅	-	✅	-	✅	-	✅	✅
uksouth	-	-	-	-	-	-	✅	✅	-	-	-	✅	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	✅	-	-	-	-
westus	✅	✅	✅	✅	✅	-	✅	-	✅	✅	-	-	-	✅	✅	-
westus3	✅	✅	✅	✅	✅	-	✅	-	-	✅	-	-	-	-	✅	-

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo

Selecionar acesso do cliente

Além das regiões acima que estão disponíveis para todos os clientes do Azure OpenAI, alguns clientes pré-existentes selecionados receberam acesso a versões do GPT-4 em regiões adicionais:

Modelo	País/Região
`gpt-4` (0314) `gpt-4-32k` (0314)	Leste dos EUA França Central Centro-Sul dos EUA Sul do Reino Unido
`gpt-4` (0613) `gpt-4-32k` (0613)	Leste dos EUA Leste dos EUA 2 Leste do Japão Sul do Reino Unido

Modelos GPT-3.5

Incorporação de modelos

Região	incorporação de texto-3-pequeno, 1	incorporação de texto-3-grande, 1	incorporação de texto-ada-002, 1	incorporação de texto-ada-002, 2
australiaeast	✅	✅	-	✅
brazilsouth	-	-	-	✅
canadaeast	✅	✅	-	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	-	✅
francecentral	-	✅	-	✅
japaneast	✅	✅	-	✅
northcentralus	-	-	-	✅
norwayeast	-	✅	-	✅
PolóniaCentral	-	✅	-	-
southafricanorth	-	-	-	✅
E.U.A Centro-Sul	-	-	✅	✅
southindia	-	✅	-	✅
suécia central	-	✅	-	✅
switzerlandnorth	✅	✅	-	✅
uaenorth	-	-	-	✅
uksouth	-	✅	-	✅
westeurope	-	-	-	✅
westus	✅	-	-	✅
westus3	-	✅	-	✅

Esses modelos só podem ser usados com solicitações de API de incorporação.

Nota

text-embedding-3-large é o modelo de incorporação mais recente e mais capaz. Não é possível atualizar entre modelos de incorporação. Para migrar do uso text-embedding-ada-002 para text-embedding-3-large você, seria necessário gerar novas incorporações.

Model ID	Solicitação máxima (tokens)	Dimensões de saída	Dados de formação (até)
`text-embedding-ada-002` (versão 2)	8,192	1,536	Setembro 2021
`text-embedding-ada-002` (versão 1)	2,046	1,536	Setembro 2021
`text-embedding-3-large`	8,192	3,072	Setembro 2021
`text-embedding-3-small`	8,192	1,536	Setembro 2021

Nota

Ao enviar uma matriz de entradas para incorporação, o número máximo de itens de entrada na matriz por chamada para o ponto de extremidade de incorporação é 2048.

Modelos de geração de imagem

Região	DALL-E-2, 2,0	DALL-E-3, 3,0
australiaeast	-	✅
eastus	✅	✅
suécia central	-	✅

Modelos DALL-E

Model ID	Max Request (caracteres)
dalle2 (pré-visualização)	1,000
DALL-E-3	4,000

Modelos de áudio

Região	TTS, 001	TTS-HD, 001	sussurro, 001
eastus2	-	-	✅
northcentralus	✅	✅	✅
norwayeast	-	-	✅
southindia	-	-	✅
suécia central	✅	✅	✅
switzerlandnorth	-	-	✅
uaenorth	-	-	✅
westeurope	-	-	✅

Modelos de sussurro

Model ID	Max Request (tamanho do arquivo de áudio)
`whisper`	25 MB

Modelos de conversão de texto em fala (Pré-visualização)

Model ID	Description
`tts`	O mais recente modelo de texto para fala do Azure OpenAI, otimizado para velocidade.
`tts-hd`	O mais recente modelo de texto para fala do Azure OpenAI, otimizado para qualidade.

Modelos de acabamentos

babbage-002 e davinci-002 não são treinados para seguir instruções. A consulta a esses modelos básicos deve ser feita apenas como um ponto de referência para uma versão ajustada para avaliar o progresso do seu treinamento.

Região	GPT-35-turbo-instrução, 0914	Babbage-002, 1	Davinci-002, 1
eastus	✅	-	-
northcentralus	-	✅	✅
suécia central	✅	✅	✅

Modelos de ajuste fino

Nota

gpt-35-turbo - O ajuste fino deste modelo é limitado a um subconjunto de regiões e não está disponível em todas as regiões em que o modelo base está disponível.

As regiões com suporte para ajuste fino podem variar se você usar modelos do Azure OpenAI em um projeto do Azure AI Foundry versus fora de um projeto.

Model ID	Regiões de ajuste fino	Solicitação máxima (tokens)	Dados de formação (até)
`babbage-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,384	Setembro 2021
`davinci-002`	Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,384	Setembro 2021
`gpt-35-turbo` (0613)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	4,096	Setembro 2021
`gpt-35-turbo` (1106)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	Entrada: 16.385 Saída: 4.096	Setembro 2021
`gpt-35-turbo` (0125)	Leste US2 Centro-Norte dos EUA Suécia Central Oeste da Suíça	16,385	Setembro 2021
`gpt-4` (0613) ¹	Centro-Norte dos EUA Suécia Central	8192	Setembro 2021
`gpt-4o-mini` (2024-07-18)	Centro-Norte dos EUA Suécia Central	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 64.536	Outubro de 2023
`gpt-4o` (2024-08-06)	Leste US2 Centro-Norte dos EUA Suécia Central	Entrada: 128.000 Potência: 16.384 Duração do contexto do exemplo de treinamento: 64.536	Outubro de 2023

1 GPT-4 está atualmente em pré-visualização pública.

Assistentes (Pré-visualização)

Para assistentes, precisa de uma combinação de um modelo suportado e uma região suportada. Certas ferramentas e capacidades requerem os modelos mais recentes. Os modelos a seguir estão disponíveis na API de Assistentes, SDK e Azure AI Foundry. A tabela a seguir é para pagamento conforme o uso. Para obter informações sobre a disponibilidade da PTU (Unidade de Taxa de Transferência Provisionada), consulte Taxa de transferência provisionada. Os modelos e regiões listados podem ser usados com os Assistentes v1 e v2. Você pode usar modelos padrão globais se eles forem suportados nas regiões listadas abaixo.

Região	GPT-4O, 2024-05-13	GPT-4O, 2024-08-06	GPT-4O-Mini, 2024-07-18	GPT-4, 0613	gpt-4, 1106-Pré-visualização	gpt-4, 0125-Pré-visualização	GPT-4, turbo-2024-04-09	GPT-4-32K, 0613	GPT-35-TURBO, 0613	GPT-35-Turbo, 1106	GPT-35-Turbo, 0125	GPT-35-TURBO-16K, 0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
canadaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
northcentralus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
norwayeast	-	-	-	-	✅	-	-	-	-	-	-	-
E.U.A Centro-Sul	✅	✅	✅	-	-	✅	✅	-	-	-	✅	-
southindia	-	-	-	-	✅	-	-	-	-	✅	✅	-
suécia central	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
norte da suíça	-	-	-	✅	-	-	-	✅	✅	-	✅	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westeurope	-	-	-	-	-	-	-	-	-	-	-	-
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Modelo de aposentadoria

Para obter as informações mais recentes sobre modelos de aposentadoria, consulte o guia de aposentadoria modelo.

Partilhar via

Modelos Azure OpenAI Service

Modelos O1 e O1-mini de acesso limitado

Disponibilidade

Disponibilidade da região

GPT-4o-Pré-visualização em tempo real

GPT-4o e GPT-4 Turbo

Como faço para acessar os modelos GPT-4o e GPT-4o mini?

GPT-4 Turbo

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

Diferenças do gpt-4 vision-preview

Disponibilidade gerenciada provisionada GPT-4 Turbo

Implantando o GPT-4 Turbo com o Vision GA

GPT-4

Modelos GPT-4 e GPT-4 Turbo

GPT-3,5

Incorporações

DALL-E

Sussurro

Conversão de texto em fala (Pré-visualização)

Tabela de resumo do modelo e disponibilidade da região

Modelos por tipo de implantação

Disponibilidade do modelo padrão global

Modelos padrão por ponto final

Conclusão do chat

Disponibilidade dos modelos GPT-4 e GPT-4 Turbo

Selecionar acesso do cliente

Modelos GPT-3.5

Modelos de ajuste fino

Assistentes (Pré-visualização)

Modelo de aposentadoria

Próximos passos

Comentários

Recursos adicionais