O que há de novo no Serviço OpenAI do Azure

Artigo
01/30/2025

Este artigo fornece um resumo das versões mais recentes e das principais atualizações de documentação para o Serviço OpenAI do Azure.

janeiro de 2025

O3-mini lançado

o3-mini (2025-01-31) é o mais recente modelo de raciocínio, oferecendo capacidades de raciocínio melhoradas. Para obter mais informações, consulte nosso guia de modelo de raciocínio.

Conclusão de áudio GPT-4o

O gpt-4o-audio-preview modelo já está disponível para implantações globais nas regiões Leste dos EUA 2 e Suécia Central. Use o gpt-4o-audio-preview modelo para geração de áudio.

O gpt-4o-audio-preview modelo introduz a modalidade de áudio na API existente /chat/completions . O modelo de áudio expande o potencial para aplicações de IA em interações baseadas em texto e voz e análise de áudio. As modalidades suportadas no gpt-4o-audio-preview modelo incluem: texto, áudio e texto + áudio. Para obter mais informações, consulte o guia de início rápido de geração de áudio.

Nota

A API em tempo real usa o mesmo modelo de áudio GPT-4o subjacente que a API de conclusão, mas é otimizada para interações de áudio em tempo real de baixa latência.

GPT-4o API em tempo real 2024-12-17

A gpt-4o-realtime-preview versão do modelo 2024-12-17 está disponível para implantações globais nas regiões Leste dos EUA 2 e Suécia Central. Use o gpt-4o-realtime-preview modelo de versão 2024-12-17 em vez do modelo de gpt-4o-realtime-preview versão 2024-10-01-preview para interações de áudio em tempo real.

Adicionado suporte para cache de prompt com o gpt-4o-realtime-preview modelo.
Adicionado suporte para novas vozes. Os gpt-4o-realtime-preview modelos agora suportam as seguintes vozes: "liga", "cinza", "balada", "coral", "eco", "sábio", "brilho", "verso".
Os limites de tarifa não se baseiam mais em conexões por minuto. O limite de taxa agora é baseado em RPM (solicitações por minuto) e TPM (tokens por minuto) para o gpt-4o-realtime-preview modelo. Os limites de taxa para cada gpt-4o-realtime-preview implantação de modelo são 100K TPM e 1K RPM. Durante a visualização, o portal e as APIs do Azure AI Foundry podem mostrar incorretamente limites de taxa diferentes. Mesmo se você tentar definir um limite de taxa diferente, o limite de taxa real será de 100K TPM e 1K RPM.

Para obter mais informações, consulte o início rápido de áudio em tempo real GPT-4o e o guia de instruções.

Dezembro de 2024

O1 Modelo de raciocínio liberado para acesso limitado

O modelo mais recente o1 já está disponível para acesso à API e implantação do modelo. O registro é necessário e o acesso será concedido com base nos critérios de elegibilidade da Microsoft. Os clientes que se inscreveram anteriormente e receberam acesso ao o1-preview, não precisam se recandidatar, pois estão automaticamente na lista de espera para o modelo mais recente.

Solicitar acesso: aplicativo modelo de acesso limitado

Para saber mais sobre os modelos avançados o1 da série, consulte Introdução aos modelos de raciocínio da série o1.

Disponibilidade da região

Modelo	País/Região
`o1` (Versão: 2024-12-17)	Leste US2 (Padrão Global) Suécia Central (Norma Global)

Ajuste fino de preferências (visualização)

A otimização de preferência direta (DPO) é uma nova técnica de alinhamento para modelos de linguagem grande, projetada para ajustar os pesos dos modelos com base nas preferências humanas. Ao contrário da aprendizagem por reforço a partir do feedback humano (RLHF), o DPO não requer o ajuste de um modelo de recompensa e usa dados mais simples (preferências binárias) para treinamento. Este método é computacionalmente mais leve e rápido, tornando-o igualmente eficaz no alinhamento e sendo mais eficiente. O DPO é especialmente útil em cenários onde elementos subjetivos como tom, estilo ou preferências específicas de conteúdo são importantes. Temos o prazer de anunciar a visualização pública do DPO no Serviço OpenAI do Azure, começando com o gpt-4o-2024-08-06 modelo.

Para ajustar a disponibilidade da região do modelo, consulte a página de modelos.

Acabamentos armazenados e destilação

As finalizações armazenadas permitem capturar o histórico de conversas de sessões de conclusão de bate-papo para usar como conjuntos de dados para avaliações e ajustes.

GPT-4o 2024-11-20

gpt-4o-2024-11-20 agora está disponível para implantação padrão global em:

E.U.A. Leste
E.U.A. Leste 2
E.U.A. Centro-Norte
E.U.A. Centro-Sul
E.U.A. Oeste
EUA Oeste 3
Suécia Central

NOVO tipo de implantação provisionada de zona de dados

As implantações provisionadas de zona de dados estão disponíveis no mesmo recurso do Azure OpenAI que todos os outros tipos de implantação do Azure OpenAI, mas permitem que você aproveite a infraestrutura global do Azure para rotear dinamicamente o tráfego para o data center dentro da zona de dados definida pela Microsoft com a melhor disponibilidade para cada solicitação. As implantações provisionadas de zona de dados fornecem capacidade de processamento de modelo reservado para uma taxa de transferência alta e previsível usando a infraestrutura do Azure dentro de zonas de dados especificadas pela Microsoft. As implantações provisionadas de zona de dados são suportadas em gpt-4o-2024-08-06, gpt-4o-2024-05-13e gpt-4o-mini-2024-07-18 modelos.

Para obter mais informações, consulte o guia de tipos de implantação.

Novembro de 2024

Visão Ajuste fino GA

Ajuste fino de visão com GPT-4o (2024-08-06) em agora disponível em geral (GA).

O ajuste fino da visão permite que você adicione imagens aos seus dados de treinamento JSONL . Assim como você pode enviar uma ou várias entradas de imagem para finalizações de bate-papo, você pode incluir esses mesmos tipos de mensagem em seus dados de treinamento. As imagens podem ser fornecidas como URLs ou como imagens codificadas base64.

Para ajustar a disponibilidade da região do modelo, consulte a página de modelos.

NOVO monitoramento de abuso de IA

Estamos introduzindo novas formas de monitoramento de abuso que aproveitam LLMs para melhorar a eficiência da deteção de uso potencialmente abusivo do serviço Azure OpenAI e para habilitar o monitoramento de abuso sem a necessidade de revisão humana de prompts e conclusão. Saiba mais, consulte Monitoramento de abuso.

Prompts e finalizações sinalizados por meio da classificação de conteúdo e/ou identificados como parte de um padrão de uso potencialmente abusivo são submetidos a um processo de revisão adicional para ajudar a confirmar a análise do sistema e informar as decisões de ação. Nossos sistemas de monitoramento de abuso foram expandidos para permitir a revisão por LLM por padrão e por humanos quando necessário e apropriado.

Outubro de 2024

NOVO tipo de implantação padrão de zona de dados

As implantações padrão da zona de dados estão disponíveis no mesmo recurso do Azure OpenAI que todos os outros tipos de implantação do Azure OpenAI, mas permitem que você aproveite a infraestrutura global do Azure para rotear dinamicamente o tráfego para o data center dentro da zona de dados definida pela Microsoft com a melhor disponibilidade para cada solicitação. O padrão de zona de dados fornece cotas padrão mais altas do que nossos tipos de implantação baseados em geografia do Azure. Há suporte para implantações padrão de zona de dados em gpt-4o-2024-08-06, gpt-4o-2024-05-13e gpt-4o-mini-2024-07-18 modelos.

Para obter mais informações, consulte o guia de tipos de implantação.

Lote Global GA

O lote global do Azure OpenAI agora está disponível para o público em geral.

A API de Lote do Azure OpenAI foi projetada para lidar com tarefas de processamento de grande escala e alto volume de forma eficiente. Processe grupos assíncronos de solicitações com cota separada, com prazo de entrega de 24 horas, a um custo 50% menor do que o padrão global. Com o processamento em lote, em vez de enviar uma solicitação de cada vez, você envia um grande número de solicitações em um único arquivo. As solicitações globais em lote têm uma cota de token enfileirada separada, evitando qualquer interrupção de suas cargas de trabalho online.

Os principais casos de utilização incluem:

Processamento de dados em larga escala: analise rapidamente conjuntos de dados extensos em paralelo.
Geração de conteúdo: crie grandes volumes de texto, como descrições de produtos ou artigos.
Revisão e Resumo de Documentos: Automatize a revisão e o resumo de documentos extensos.
Automação do suporte ao cliente: lide com várias consultas simultaneamente para respostas mais rápidas.
Extração e Análise de Dados: Extraia e analise informações de grandes quantidades de dados não estruturados.
Tarefas de Processamento de Linguagem Natural (NLP): Execute tarefas como análise de sentimento ou tradução em grandes conjuntos de dados.
Marketing e Personalização: Gere conteúdo personalizado e recomendações em escala.

Para obter mais informações sobre como começar a usar implantações em lote global.

Modelos O1-Preview e O1-mini de acesso limitado

Os o1-preview modelos e o1-mini agora estão disponíveis para acesso à API e implantação de modelos. O registro é necessário e o acesso será concedido com base nos critérios de elegibilidade da Microsoft.

Solicitar acesso: aplicativo modelo de acesso limitado

Os clientes que já foram aprovados e têm acesso ao modelo por meio do playground de acesso antecipado não precisam se inscrever novamente, você receberá automaticamente acesso à API. Depois que o acesso for concedido, você precisará criar uma implantação para cada modelo.

Suporte API:

O suporte para os modelos da série o1 foi adicionado na versão 2024-09-01-previewAPI.

O max_tokens parâmetro foi preterido e substituído pelo novo max_completion_tokens parâmetro. Os modelos da série O1 só funcionam com o max_completion_tokens parâmetro.

Disponibilidade da região:

Os modelos estão disponíveis para implantação padrão e padrão global no Leste dos EUA2 e na Suécia Central para clientes aprovados.

Nova API GPT-4o em tempo real para pré-visualização pública de voz e áudio

O áudio GPT-4o do Azure OpenAI faz parte da família de modelos GPT-4o que suporta interações conversacionais de baixa latência, "speech in, speech out". A API de áudio realtime GPT-4o foi projetada para lidar com interações conversacionais em tempo real e de baixa latência, tornando-se uma ótima opção para casos de uso envolvendo interações ao vivo entre um usuário e um modelo, como agentes de suporte ao cliente, assistentes de voz e tradutores em tempo real.

O gpt-4o-realtime-preview modelo está disponível para implantações globais nas regiões Leste dos EUA 2 e Suécia Central.

Para obter mais informações, consulte o início rápido de áudio em tempo real GPT-4o.

Atualizações globais de suporte em lote

O lote global agora suporta GPT-4o (2024-08-06). Consulte o guia de introdução ao lote global para obter mais informações.

Setembro de 2024

Atualizações do Azure OpenAI Studio UX

A partir de 19 de setembro de 2024, quando você acessa o Azure OpenAI Studio , não vê mais o Azure OpenAI Studio herdado por padrão. Se necessário, você ainda poderá voltar à experiência anterior usando o botão Alternar para a aparência antiga na barra superior da interface do usuário nas próximas semanas. Se você voltar para o portal herdado do Azure AI Foundry, será útil preencher o formulário de comentários para nos informar por quê. Estamos monitorando ativamente esse feedback para melhorar a nova experiência.

Implantações provisionadas GPT-4o 2024-08-06

O GPT-4o 2024-08-06 já está disponível para implantações provisionadas no Leste dos EUA, Leste dos EUA 2, Centro-Norte dos EUA e Suécia Central. Também está disponível para implantações provisionadas globais.

Para obter as informações mais recentes sobre a disponibilidade do modelo, consulte a página de modelos.

NOVO Tipo de implantação provisionada global

As implantações globais estão disponíveis nos mesmos recursos do Azure OpenAI que os tipos de implantação não globais, mas permitem que você aproveite a infraestrutura global do Azure para rotear dinamicamente o tráfego para o data center com a melhor disponibilidade para cada solicitação. As implantações provisionadas globais fornecem capacidade de processamento de modelo reservado para uma taxa de transferência alta e previsível usando a infraestrutura global do Azure. Há suporte para implantações provisionadas globais em gpt-4o-2024-08-06 modelos e gpt-4o-mini-2024-07-18 modelos.

Para obter mais informações, consulte o guia de tipos de implantação.

NOVOS modelos o1-preview e o1-mini disponíveis para acesso limitado

O Azure OpenAI o1-preview e o1-mini os modelos são projetados para lidar com tarefas de raciocínio e resolução de problemas com maior foco e capacidade. Esses modelos gastam mais tempo processando e entendendo a solicitação do usuário, tornando-os excepcionalmente fortes em áreas como ciência, codificação e matemática em comparação com iterações anteriores.

Principais capacidades da série o1

Geração de código complexa: Capaz de gerar algoritmos e lidar com tarefas avançadas de codificação para dar suporte aos desenvolvedores.
Resolução Avançada de Problemas: Ideal para sessões de brainstorming abrangentes e para enfrentar desafios multifacetados.
Comparação complexa de documentos: Perfeita para analisar contratos, arquivos de casos ou documentos legais para identificar diferenças sutis.
Acompanhamento de instruções e gerenciamento de fluxo de trabalho: Particularmente eficaz para gerenciar fluxos de trabalho que exigem contextos mais curtos.

Variantes de modelo

o1-preview: o1-preview é o mais capaz dos modelos de o1 série.
o1-mini: o1-mini é o mais rápido e mais barato dos o1 modelos da série.

Versão do modelo: 2024-09-12

Solicitar acesso: aplicativo modelo de acesso limitado

Limitações

Os o1 modelos da série estão atualmente em pré-visualização e não incluem alguns recursos disponíveis em outros modelos, como compreensão de imagem e saídas estruturadas que estão disponíveis no modelo GPT-4o mais recente. Para muitas tarefas, os modelos GPT-4o geralmente disponíveis ainda podem ser mais adequados.

Segurança

A OpenAI incorporou medidas de segurança adicionais nos o1 modelos, incluindo novas técnicas para ajudar os modelos a recusar pedidos inseguros. Estes avanços fazem da o1 série alguns dos modelos mais robustos disponíveis.

Disponibilidade

Os o1-preview e o1-mini estão disponíveis na região Leste dos EUA2 para acesso limitado por meio do playground de acesso antecipado do portal Azure AI Foundry. O processamento de dados para os o1 modelos pode ocorrer em uma região diferente daquela em que eles estão disponíveis para uso.

Para experimentar os o1-preview modelos e o1-mini no playground de acesso antecipado é necessário registrar-se, e o acesso será concedido com base nos critérios de elegibilidade da Microsoft.

Solicitar acesso: aplicativo modelo de acesso limitado

Uma vez concedido o acesso, terá de:

Navegue até um https://ai.azure.com/resources recurso na região e selecione-o eastus2 . Se você não tiver um recurso do Azure OpenAI nessa região, precisará criar um.
Depois que o eastus2 recurso do Azure OpenAI estiver selecionado, no painel superior esquerdo, em Playgrounds , selecione Early access playground (preview).

Agosto de 2024

GPT-4o 2024-08-06 saídas estruturadas

Disponível para implantações padrão e globais em todas as regiões dos EUA e Suécia Central.
Este modelo adiciona suporte para saídas estruturadas.

Implantações provisionadas GPT-4o mini

O GPT-4o mini agora está disponível para implantações provisionadas no Leste do Canadá, Leste dos EUA, Leste dos EUA2, Centro-Norte dos EUA e Suécia Central.

Para obter as informações mais recentes sobre a disponibilidade do modelo, consulte a página de modelos.

Ajuste fino GPT-4o (Visualização pública)

O ajuste fino do GPT-4o agora está disponível para o Azure OpenAI em visualização pública no Centro-Norte dos EUA e na Suécia Central.

Para obter mais informações, consulte nossa postagem no blog.

Nova versão da API de pré-visualização

A versão 2024-07-01-preview da API é a versão mais recente da API de autoria do plano de dados & inferência. Ele substitui a versão 2024-05-01-preview da API e adiciona suporte para:

Suporte à API em lote adicionado
Parâmetros de estratégia de fragmentação de armazenamento vetorial
max_num_results que a ferramenta de pesquisa de arquivos deve produzir.

Para mais informações, consulte a nossa documentação de referência

GPT-4o mini disponibilidade regional

O GPT-4o mini está disponível para implantação padrão e padrão global nas regiões Leste dos EUA e Suécia Central.
O GPT-4o mini está disponível para implantação global em lote nas regiões Leste dos EUA, Suécia Central e Oeste dos EUA.

Guia de avaliações

Nova postagem no blog sobre como começar a usar avaliações de modelos. Recomendamos o uso deste guia como parte do processo de atualização e desativação do modelo.

Último modelo GPT-4o disponível no parque infantil de acesso antecipado (pré-visualização)

Em 6 de agosto de 2024, a OpenAI anunciou a versão mais recente de sua versão 2024-08-06principal do modelo GPT-4o. GPT-4o 2024-08-06 tem todas as capacidades da versão anterior, bem como:

Uma capacidade melhorada para suportar resultados estruturados complexos.
Os tokens de saída máxima foram aumentados de 4.096 para 16.384.

Os clientes do Azure podem testar o GPT-4o 2024-08-06 hoje no novo playground de acesso antecipado do Azure AI Foundry (visualização).

Ao contrário do playground de acesso antecipado anterior, o playground de acesso antecipado (visualização) do portal do Azure AI Foundry não exige que você tenha um recurso em uma região específica.

Nota

Os prompts e as conclusões feitas por meio do playground de acesso antecipado (visualização) podem ser processados em qualquer região do Azure OpenAI e atualmente estão sujeitos a uma solicitação de 10 por minuto por limite de assinatura do Azure. Este limite pode mudar no futuro.

O monitoramento de abuso do Serviço OpenAI do Azure está habilitado para todos os usuários de playground de acesso antecipado, mesmo se aprovado para modificação; Os filtros de conteúdo padrão estão habilitados e não podem ser modificados.

Para testar o GPT-4o 2024-08-06, entre no playground de acesso antecipado da IA do Azure (visualização) usando este link.

Implantações globais em lote já estão disponíveis

Os principais casos de utilização incluem:

Processamento de dados em larga escala: analise rapidamente conjuntos de dados extensos em paralelo.
Geração de conteúdo: crie grandes volumes de texto, como descrições de produtos ou artigos.
Revisão e Resumo de Documentos: Automatize a revisão e o resumo de documentos extensos.
Automação do suporte ao cliente: lide com várias consultas simultaneamente para respostas mais rápidas.
Extração e Análise de Dados: Extraia e analise informações de grandes quantidades de dados não estruturados.
Tarefas de Processamento de Linguagem Natural (NLP): Execute tarefas como análise de sentimento ou tradução em grandes conjuntos de dados.
Marketing e Personalização: Gere conteúdo personalizado e recomendações em escala.

Para obter mais informações sobre como começar a usar implantações em lote global.

Julho de 2024

GPT-4o mini já está disponível para ajuste fino

O mini ajuste fino GPT-4o já está disponível em pré-visualização pública na Suécia Central e no Centro-Norte dos EUA.

A ferramenta de pesquisa de arquivos Assistants agora é cobrada

A ferramenta de pesquisa de ficheiros para Assistentes tem agora custos adicionais pela utilização. Consulte a página de preços para obter mais informações.

Modelo mini GPT-4o disponível para implantação

GPT-4o mini é o mais recente modelo OpenAI do Azure anunciado pela primeira vez em 18 de julho de 2024:

"O GPT-4o mini permite que os clientes forneçam aplicações impressionantes a um custo mais baixo com uma velocidade impressionante. O GPT-4o mini é significativamente mais inteligente do que o GPT-3.5 Turbo — pontuando 82% na medição do Massive Multitask Language Understanding (MMLU) em comparação com 70% — e é mais de 60% mais barato.1 O modelo oferece uma janela de contexto expandida de 128K e integra os recursos multilíngues aprimorados do GPT-4o, trazendo maior qualidade para idiomas de todo o mundo."

O modelo está atualmente disponível para implantação padrão e padrão global na região Leste dos EUA.

Para obter informações sobre a cota modelo, consulte a página de cotas e limites e, para obter as informações mais recentes sobre a disponibilidade do modelo, consulte a página de modelos.

Nova política de filtragem de conteúdo padrão de IA responsável

A nova política DefaultV2 de filtragem de conteúdo padrão oferece as mais recentes mitigações de segurança e proteção para a série de modelos GPT (texto), incluindo:

Prompt Shields para ataques de jailbreak em prompts do usuário (filtro),
Deteção de material protegido para texto (filtro) em completações de modelo
Deteção de material protegido para código (anotação) em completações de modelo

Embora não haja alterações nos filtros de conteúdo para recursos e implantações existentes (as configurações de filtragem de conteúdo padrão ou personalizadas permanecem inalteradas), novos recursos e implantações GPT herdarão automaticamente a nova política DefaultV2de filtragem de conteúdo. Os clientes têm a opção de alternar entre padrões de segurança e criar configurações personalizadas de filtragem de conteúdo.

Consulte a nossa documentação da política de segurança padrão para obter mais informações.

Nova versão da API do GA

A versão 2024-06-01 da API é a versão mais recente da API de inferência do plano de dados GA. Ele substitui a versão 2024-02-01 da API e adiciona suporte para:

incorpora encoding_format parâmetros & dimensions .
conclusão do logprobs chat & top_logprobs parâmetros.

Consulte nossa documentação de referência de inferência de plano de dados para obter mais informações.

Expansão das regiões disponíveis para implantações padrão globais do gpt-4o

O GPT-4o agora está disponível para implantações padrão globais em:

australiaeast
brazilsouth
canadaeast
eastus
eastus2
FranceCentral Git
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
PolóniaCentral
southafricanorth
E.U.A Centro-Sul
southindia
suécia central
norte da suíça
uksouth
westeurope
westus
westus3

Para obter informações sobre a quota normalizada global, consulte a página de quotas e limites.

junho de 2024

Atualizações da data de aposentadoria

Data de aposentadoria 0301 atualizada gpt-35-turbo para não antes de 1º de outubro de 2024.
Data de aposentadoria atualizada gpt-35-turbo de 0613 gpt-35-turbo-16kpara 1º de outubro de 2024.
Data gpt-4 de substituição atualizada para gpt-4-32k 1º de outubro de 2024 e data de aposentadoria para 6 de junho de 2025.

Consulte o nosso guia de aposentadoria modelo para obter as informações mais recentes sobre a descontinuação do modelo e a aposentadoria.

Faturamento baseado em token para ajuste fino

O ajuste fino de faturamento do Azure OpenAI agora é baseado no número de tokens em seu arquivo de treinamento, em vez do tempo total de treinamento decorrido. Isso pode resultar em uma redução significativa de custos para algumas execuções de treinamento e torna a estimativa de custos de ajuste fino muito mais fácil. Para saber mais, você pode consultar o edital oficial.

GPT-4o lançado em novas regiões

O GPT-4o está agora também disponível em:
- Suécia Central para implantação regional padrão.
- Leste da Austrália, Leste do Canadá, Leste do Japão, Coreia Central, Suécia Central, Suíça Norte, & Oeste dos EUA 3 para implantação provisionada.

Para obter as informações mais recentes sobre a disponibilidade do modelo, consulte a página de modelos.

Suporte de chave gerenciada pelo cliente (CMK) para assistentes

Threads and Files in Assistants agora suporta CMK na seguinte região:

EUA Oeste 3

maio de 2024

Implantações provisionadas GPT-4o

gpt-4o Versão: 2024-05-13 está disponível para implantações padrão e provisionadas. As implantações de modelo padrão e provisionado aceitam solicitações de inferência de texto e imagem/visão. Para obter informações sobre a disponibilidade regional do modelo, consulte a matriz do modelo para implantações provisionadas.

Assistentes v2 (pré-visualização)

Uma atualização da API de assistentes agora está disponível publicamente. Ele contém as seguintes atualizações:

Ferramenta de pesquisa de arquivos e armazenamento vetorial
Conclusão máxima e suporte de token de prompt máximo para gerenciar o uso de token.
tool_choice parâmetro para forçar o Assistente a usar uma ferramenta especificada. Agora você pode criar mensagens com a função de assistente para criar históricos de conversas personalizados em Threads.
Suporte para temperature, top_p, response_formatparâmetros.
Suporte a streaming e sondagem. Você pode usar as funções auxiliares em nosso SDK Python para criar execuções e respostas de fluxo. Também adicionamos auxiliares do SDK de sondagem para compartilhar atualizações de status de objeto sem a necessidade de sondagem.
Experimente aplicativos lógicos e chamadas de função usando o Azure OpenAI Studio. Importe suas APIs REST implementadas em Aplicativos Lógicos como funções e o estúdio invoca a função (como um fluxo de trabalho de Aplicativos Lógicos) automaticamente com base no prompt do usuário.
O AutoGen by Microsoft Research fornece uma estrutura de conversação multiagente para permitir a criação conveniente de fluxos de trabalho LLM (Large Language Model) em uma ampla gama de aplicativos. Os assistentes do Azure OpenAI agora estão integrados ao AutoGen por meio do GPTAssistantAgent, um novo agente experimental que permite adicionar Assistentes perfeitamente a fluxos de trabalho multiagente baseados em AutoGen. Isso permite que vários assistentes do Azure OpenAI que podem ser especializados em tarefas ou domínios colaborem e lidem com tarefas complexas.
Suporte para modelos ajustados gpt-3.5-turbo-0125nas seguintes regiões:
- E.U.A. Leste 2
- Suécia Central
Apoio regional alargado para:
- Leste do Japão
- Sul do Reino Unido
- E.U.A. Oeste
- EUA Oeste 3
- Leste da Noruega

Para obter mais informações, consulte a postagem no blog sobre assistentes.

Disponibilidade geral (GA) do modelo GPT-4o

GPT-4o ("o is for "omni") é o mais recente modelo da OpenAI lançado em 13 de maio de 2024.

O GPT-4o integra texto e imagens em um único modelo, permitindo lidar com vários tipos de dados simultaneamente. Esta abordagem multimodal aumenta a precisão e a capacidade de resposta nas interações homem-computador.
O GPT-4o combina com o GPT-4 Turbo em tarefas de texto e codificação em inglês, oferecendo um desempenho superior em idiomas diferentes do inglês e em tarefas de visão, estabelecendo novos padrões de referência para os recursos de IA.

Para obter informações sobre a disponibilidade regional do modelo, consulte a página de modelos.

Tipo de implantação padrão global (visualização)

As implantações globais estão disponíveis nos mesmos recursos do Azure OpenAI que as ofertas não globais, mas permitem que você aproveite a infraestrutura global do Azure para rotear dinamicamente o tráfego para o data center com a melhor disponibilidade para cada solicitação. O padrão global fornece a cota padrão mais alta para novos modelos e elimina a necessidade de balanceamento de carga em vários recursos.

Para obter mais informações, consulte o guia de tipos de implantação.

Atualizações de ajuste fino

O ajuste fino do GPT-4 já está disponível em visualização pública.
Adicionado suporte para seed, eventos, estatísticas de validação completas e pontos de verificação como parte da versão da 2024-05-01-preview API.

Filtros de conteúdo configuráveis DALL-E e GPT-4 Turbo Vision GA

Crie filtros de conteúdo personalizados para suas implantações DALL-E 2 e 3, GPT-4 Turbo com Vision GA (turbo-2024-04-09) e GPT-4o. Filtragem de conteúdos

Filtro assíncrono disponível para todos os clientes do Azure OpenAI

A execução assíncrona de filtros para melhorar a latência em cenários de streaming agora está disponível para todos os clientes do Azure OpenAI. Filtragem de conteúdos

Proteções do pedido

Os Prompt Shields protegem as aplicações alimentadas por modelos OpenAI do Azure contra dois tipos de ataques: ataques diretos (jailbreak) e indiretos. Ataques Indiretos (também conhecidos como Ataques Indiretos Imediatos ou Ataques de Injeção de Prompt entre Domínios) são um tipo de ataque a sistemas alimentados por modelos de IA Generativa que podem ocorrer quando um aplicativo processa informações que não foram diretamente criadas pelo desenvolvedor do aplicativo ou pelo usuário. Filtragem de conteúdos

2024-05-01-preview Versão da API

Para obter mais informações, consulte o ciclo de vida da versão da API.

Disponibilidade geral do modelo GPT-4 Turbo (GA)

A última versão GA do GPT-4 Turbo é:

gpt-4 Versão:turbo-2024-04-09

Este é o substituto para os seguintes modelos de pré-visualização:

gpt-4 Versão:1106-Preview
gpt-4 Versão:0125-Preview
gpt-4 Versão:vision-preview

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

A versão OpenAI do mais recente 0409 modelo turbo suporta o modo JSON e a função chamando para todas as solicitações de inferência.
A versão mais recente turbo-2024-04-09 do Azure OpenAI atualmente não oferece suporte ao uso do modo JSON e da chamada de função ao fazer solicitações de inferência com entrada de imagem (visão). As solicitações de entrada baseadas em texto (solicitações sem image_url e imagens embutidas) suportam o modo JSON e a chamada de função.

Diferenças do gpt-4 vision-preview

A integração de aprimoramentos de Visão específicos da IA do Azure com o GPT-4 Turbo com Visão não é suportada para gpt-4a Versão:turbo-2024-04-09. Isso inclui Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo e processamento aprimorado de seus dados com imagens.

Importante

Os recursos de visualização de aprimoramentos de visão, incluindo Reconhecimento Ótico de Caracteres (OCR), aterramento de objetos, prompts de vídeo serão desativados e não estarão mais disponíveis quando gpt-4 Version: vision-preview for atualizado para turbo-2024-04-09. Se você estiver confiando em qualquer um desses recursos de visualização, essa atualização automática do modelo será uma grande mudança.

Disponibilidade gerenciada provisionada GPT-4 Turbo

gpt-4 Versão:turbo-2024-04-09 está disponível para implantações padrão e provisionadas. Atualmente, a versão provisionada deste modelo não suporta solicitações de inferência de imagem/visão. As implantações provisionadas desse modelo só aceitam entrada de texto. As implantações de modelo padrão aceitam solicitações de inferência de texto e imagem/visão.

Implantando o GPT-4 Turbo com o Vision GA

Para implantar o modelo GA do portal do Azure AI Foundry, selecione GPT-4 e escolha a turbo-2024-04-09 versão no menu suspenso. A cota padrão para o gpt-4-turbo-2024-04-09 modelo será a mesma cota atual para GPT-4-Turbo. Consulte os limites das quotas regionais.

Abril de 2024

O ajuste fino agora é suportado em duas novas regiões Leste dos EUA 2 e Suíça Oeste

O ajuste fino está agora disponível com suporte para:

E.U.A. Leste 2

gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Oeste da Suíça

babbage-002
davinci-002
gpt-35-turbo (0613)
gpt-35-turbo (1106)
gpt-35-turbo (0125)

Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade do modelo e o suporte ao ajuste fino em cada região.

Exemplos de treinamento de bate-papo em vários turnos

O ajuste fino agora suporta exemplos de treinamento de bate-papo em vários turnos.

O GPT-4 (0125) está disponível para o Azure OpenAI On Your Data

Agora você pode usar o modelo GPT-4 (0125) em regiões disponíveis com o Azure OpenAI On Your Data.

Março de 2024

Riscos e monitoramento de segurança no Azure OpenAI Studio

O Azure OpenAI Studio agora fornece um painel de Riscos e Segurança para cada uma de suas implantações que usa uma configuração de filtro de conteúdo. Use-o para verificar os resultados da atividade de filtragem. Em seguida, você pode ajustar sua configuração de filtro para atender melhor às suas necessidades de negócios e atender aos princípios de IA responsável.

Utilização de Riscos e Monitorização de Segurança

Azure OpenAI em suas atualizações de dados

Agora você pode se conectar a um banco de dados vetorial do Elasticsearch para ser usado com o Azure OpenAI On Your Data.
Você pode usar o parâmetro chunk size durante a ingestão de dados para definir o número máximo de tokens de qualquer bloco de dados em seu índice.

2024-02-01 Lançada a API de disponibilidade geral (GA)

Esta é a versão mais recente da API do GA e é a substituição da versão anterior 2023-05-15 do GA. Esta versão adiciona suporte para os recursos mais recentes do Azure OpenAI GA, como Whisper, DALLE-3, ajuste fino, em seus dados e muito mais.

Recursos que estão em visualização, como Assistentes, texto para fala (TTS) e algumas das fontes de dados "em seus dados", exigem uma versão de API de visualização. Para obter mais informações, consulte nosso guia de ciclo de vida da versão da API.

Sussurrar disponibilidade geral (GA)

O modelo Whisper speech to text agora é GA para REST e Python. Os SDKs da biblioteca de cliente ainda estão em visualização pública.

Experimente o Whisper seguindo um início rápido.

Disponibilidade geral do DALL-E 3 (GA)

O modelo de geração de imagens DALL-E 3 agora é GA para REST e Python. Os SDKs da biblioteca de cliente ainda estão em visualização pública.

Experimente o DALL-E 3 seguindo um início rápido.

Novo suporte regional para DALL-E 3

Agora você pode acessar o DALL-E 3 com um recurso do Azure OpenAI na região ou AustraliaEast no East US Azure, além do SwedenCentral.

Descontinuações e aposentadorias de modelos

Adicionámos uma página para controlar as descontinuações e desativações de modelos no Serviço OpenAI do Azure. Esta página fornece informações sobre os modelos atualmente disponíveis, preteridos e desativados.

2024-03-01-preview API lançada

2024-03-01-preview tem a mesma funcionalidade 2024-02-15-preview e adiciona dois novos parâmetros para incorporações:

encoding_format Permite especificar o formato para gerar incorporações em float, ou base64. A predefinição é float.
dimensions Permite definir o número de incorporações de saída. Este parâmetro só é suportado com os novos modelos de incorporação de terceira geração: text-embedding-3-large, text-embedding-3-small. Normalmente, incorporações maiores são mais caras do ponto de vista de computação, memória e armazenamento. Ser capaz de ajustar o número de dimensões permite mais controle sobre o custo geral e desempenho. O dimensions parâmetro não é suportado em todas as versões da biblioteca OpenAI 1.x Python, para aproveitar este parâmetro recomendamos atualizar para a versão mais recente: pip install openai --upgrade.

Se você estiver usando uma versão de visualização da API para aproveitar os recursos mais recentes, recomendamos consultar o artigo do ciclo de vida da versão da API para acompanhar por quanto tempo sua versão atual da API será suportada.

Atualização para os planos de atualização GPT-4-1106-Preview

A atualização de implantação do 1106-Preview para gpt-4 o 0125-Preview agendada para 8 de março de gpt-4 2024 não está mais ocorrendo. As implantações das gpt-4 versões 1106-Preview e 0125-Preview definidas como "Auto-update to default" e "Upgrade when expired" começarão a ser atualizadas após o lançamento de uma versão estável do modelo.

Para obter mais informações sobre o processo de atualização, consulte a página de modelos.

Fevereiro de 2024

Modelo GPT-3.5-turbo-0125 disponível

Este modelo tem várias melhorias, incluindo maior precisão na resposta nos formatos solicitados e uma correção para um bug que causou um problema de codificação de texto para chamadas de função de idioma diferente do inglês.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Modelos de incorporação de terceira geração disponíveis

text-embedding-3-large
text-embedding-3-small

Em testes, a OpenAI relata que os modelos de incorporação de terceira geração grandes e pequenos oferecem melhor desempenho médio de recuperação em vários idiomas com o benchmark MIRACL , mantendo ainda um melhor desempenho para tarefas em inglês com o benchmark MTEB do que o modelo text-embedding-ada-002 de segunda geração.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Consolidação de cotas GPT-3.5 Turbo

Para simplificar a migração entre diferentes versões dos modelos GPT-3.5-Turbo (incluindo 16k), vamos consolidar todas as quotas GPT-3.5-Turbo num único valor de quota.

Todos os clientes que tiverem aumentado a quota aprovada terão quota total combinada que reflete os aumentos anteriores.
Qualquer cliente cujo uso total atual nas versões do modelo seja menor do que o padrão receberá uma nova cota total combinada por padrão.

GPT-4-0125-preview modelo disponível

A gpt-4 versão 0125-preview do modelo agora está disponível no Serviço OpenAI do Azure nas regiões Leste dos EUA, Centro-Norte dos EUA e Centro-Sul dos EUA. Os clientes com implantações de gpt-4 versão 1106-preview serão atualizados automaticamente nas 0125-preview próximas semanas.

Para obter informações sobre disponibilidade e atualizações regionais do modelo, consulte a página de modelos.

Pré-visualização pública da API de assistentes

O Azure OpenAI agora suporta a API que alimenta os GPTs do OpenAI. Os Assistentes OpenAI do Azure (Pré-visualização) permitem-lhe criar assistentes de IA adaptados às suas necessidades através de instruções personalizadas e ferramentas avançadas, como interpretador de código e funções personalizadas. Para saber mais, veja:

Visualização pública de vozes de texto para fala OpenAI

O Serviço OpenAI do Azure agora oferece suporte a APIs de texto para fala com as vozes do OpenAI. Obtenha fala gerada por IA a partir do texto fornecido. Para saber mais, consulte o guia de visão geral e experimente o início rápido.

Nota

O Azure AI Speech também dá suporte a vozes de texto para fala do OpenAI. Para saber mais, consulte Texto do OpenAI para vozes de fala por meio do Serviço OpenAI do Azure ou do Guia de Fala do Azure AI.

Novos recursos de ajuste fino e suporte a modelos

Novo suporte regional para o Azure OpenAI On Your Data

Agora você pode usar o Azure OpenAI On Your Data na seguinte região do Azure:

Norte da África do Sul

Disponibilidade geral do Azure OpenAI On Your Data

O Azure OpenAI On Your Data agora está disponível para o público em geral.

Dezembro de 2023

Azure OpenAI em seus dados

Suporte completo de VPN e ponto final privado para o Azure OpenAI On Your Data, incluindo suporte de segurança para: contas de armazenamento, recursos do Azure OpenAI e recursos do serviço Azure AI Search.
Novo artigo para usar a configuração do Azure OpenAI On Your Data protegendo dados com redes virtuais e pontos de extremidade privados.

GPT-4 Turbo com Visão já está disponível

O serviço GPT-4 Turbo com Visão no Azure OpenAI está agora em pré-visualização pública. GPT-4 Turbo with Vision é um grande modelo multimodal (LMM) desenvolvido pela OpenAI que pode analisar imagens e fornecer respostas textuais a perguntas sobre elas. Incorpora processamento de linguagem natural e compreensão visual. Com o modo avançado, você pode usar os recursos do Azure AI Vision para gerar informações adicionais a partir das imagens.

Explore os recursos do GPT-4 Turbo com Visão em uma experiência sem código usando o Azure OpenAI Playground. Saiba mais no Guia de início rápido.
O aprimoramento da visão usando o GPT-4 Turbo com Visão agora está disponível no Azure OpenAI Playground e inclui suporte para Reconhecimento Ótico de Caracteres, aterramento de objetos, suporte de imagem para "adicionar seus dados" e suporte para prompt de vídeo.
Faça chamadas para a API de chat diretamente usando a API REST.
A disponibilidade da região está atualmente limitada a SwitzerlandNorth, SwedenCentral, WestUSe AustraliaEast
Saiba mais sobre as limitações conhecidas do GPT-4 Turbo com Visão e outras perguntas frequentes.

Novembro de 2023

Novo suporte de fonte de dados no Azure OpenAI On Your Data

Agora você pode usar o Azure Cosmos DB para MongoDB vCore e URLs/endereços da Web como fontes de dados para ingerir seus dados e conversar com um modelo do Azure OpenAI com suporte.

GPT-4 Turbo Preview & GPT-3.5-Turbo-1106 lançado

Ambos os modelos são a versão mais recente do OpenAI com instruções aprimoradas, modo JSON, saída reproduzível e chamada de função paralela.

O GPT-4 Turbo Preview tem uma janela de contexto máxima de 128.000 tokens e pode gerar 4.096 tokens de saída. Tem os mais recentes dados de formação com conhecimento até abril de 2023. Este modelo está em pré-visualização e não é recomendado para utilização em produção. Todas as implantações deste modelo de visualização serão atualizadas automaticamente assim que a versão estável estiver disponível.
O GPT-3.5-Turbo-1106 tem uma janela de contexto máxima de 16.385 tokens e pode gerar 4.096 tokens de saída.

Para obter informações sobre a disponibilidade regional do modelo, consulte a página de modelos.

Os modelos têm suas próprias alocações de cotas exclusivas por região.

Pré-visualização pública do DALL-E 3

DALL-E 3 é o modelo de última geração de imagens da OpenAI. Ele apresenta qualidade de imagem aprimorada, cenas mais complexas e melhor desempenho ao renderizar texto em imagens. Ele também vem com mais opções de proporção. DALL-E 3 está disponível através do OpenAI Studio e através da API REST. Seu recurso OpenAI deve estar na SwedenCentral região do Azure.

O DALL-E 3 inclui reescrita de prompt integrada para melhorar as imagens, reduzir a distorção e aumentar a variação natural.

Experimente o DALL-E 3 seguindo um início rápido.

IA responsável

Configurabilidade expandida do cliente: todos os clientes do Azure OpenAI agora podem configurar todos os níveis de gravidade (baixo, médio, alto) para as categorias ódio, violência, sexual e automutilação, incluindo a filtragem apenas de conteúdo de alta gravidade. Configurar filtros de conteúdo
Credenciais de conteúdo em todos os modelos DALL-E: as imagens geradas por IA de todos os modelos DALL-E agora incluem uma credencial digital que divulga o conteúdo como gerado por IA. Os aplicativos que exibem ativos de imagem podem aproveitar o SDK da Content Authenticity Initiative de código aberto para exibir credenciais em suas imagens geradas por IA. Credenciais de conteúdo no Azure OpenAI
Novos modelos RAI
- Deteção de risco de jailbreak: Os ataques de jailbreak são prompts do usuário projetados para provocar o modelo de IA generativa a exibir comportamentos que ele foi treinado para evitar ou quebrar as regras definidas na mensagem do sistema. O modelo de deteção de risco de jailbreak é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em prompts do usuário.
- Texto de material protegido: o texto de material protegido descreve o conteúdo de texto conhecido (por exemplo, letras de músicas, artigos, receitas e conteúdo da Web selecionado) que pode ser gerado por modelos de linguagem grandes. O modelo de texto de material protegido é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em finalizações LLM.
- Código de material protegido: O código de material protegido descreve o código-fonte que corresponde a um conjunto de código-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem a citação adequada de repositórios de código-fonte. O modelo de código de material protegido é opcional (padrão desativado) e está disponível no modelo de anotação e filtro. Ele é executado em finalizações LLM.
Configurar filtros de conteúdo
Listas de bloqueio: os clientes agora podem personalizar rapidamente o comportamento do filtro de conteúdo para prompts e completações, criando uma lista de bloqueio personalizada em seus filtros. A lista de bloqueio personalizada permite que o filtro execute ações em uma lista personalizada de padrões, como termos específicos ou padrões regex. Além de listas de bloqueio personalizadas, fornecemos uma lista de bloqueio de palavrões da Microsoft (inglês). Usar listas de bloqueio

Outubro de 2023

Novos modelos de ajuste fino (pré-visualização)

gpt-35-turbo-0613 está agora disponível para afinação.
babbage-002 e davinci-002 estão agora disponíveis para afinação. Esses modelos substituem os modelos básicos antigos ada, babbage, curie e davinci que estavam anteriormente disponíveis para ajuste fino.
A disponibilidade de ajuste fino é limitada a determinadas regiões. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.
Os modelos ajustados têm limites de quota diferentes dos modelos normais.
Tutorial: ajuste fino GPT-3.5-Turbo

Azure OpenAI em seus dados

Novos parâmetros personalizados para determinar o número de documentos recuperados e rigor.
- A definição de rigor define o limite para categorizar documentos como relevantes para as suas consultas.
- A configuração de documentos recuperados especifica o número de documentos com melhor pontuação do índice de dados usado para gerar respostas.
Você pode ver o status de ingestão/carregamento de dados no Azure OpenAI Studio.
Suporte para endpoints privados & VPNs para contêineres de blob.

Setembro de 2023

GPT-4

O GPT-4 e o GPT-4-32k estão agora disponíveis para todos os clientes do Serviço OpenAI do Azure. Os clientes não precisam mais solicitar a lista de espera para usar GPT-4 e GPT-4-32k (os requisitos de registro de Acesso Limitado continuam a ser aplicados a todos os modelos do Azure OpenAI). A disponibilidade pode variar de acordo com a região. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

GPT-3.5 Turbo Instrução

O Serviço Azure OpenAI agora suporta o modelo GPT-3.5 Turbo Instruct. Este modelo tem desempenho comparável e text-davinci-003 está disponível para uso com a API de conclusão. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Pré-visualização pública do sussurro

O Serviço OpenAI do Azure agora oferece suporte a APIs de fala para texto com tecnologia do modelo Whisper da OpenAI. Obtenha texto gerado por IA com base no áudio de fala fornecido. Para saber mais, confira o guia de início rápido.

Nota

O Azure AI Speech também suporta o modelo Whisper da OpenAI através da API de transcrição em lote. Para saber mais, consulte o guia Criar uma transcrição em lote. Confira O que é o modelo Whisper?, para saber mais sobre quando usar o Azure AI Speech versus o Azure OpenAI Service.

Novas Regiões

O Azure OpenAI agora também está disponível nas regiões Suécia Central e Suíça Norte. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Aumento dos limites regionais das quotas

Aumenta para os limites máximos de cota padrão para determinados modelos e regiões. A migração de cargas de trabalho para esses modelos e regiões permitirá que você aproveite os Tokens por minuto (TPM) mais altos.

Agosto de 2023

Azure OpenAI em suas próprias atualizações de dados (visualização)

Agora você pode implantar o Azure OpenAI em seus dados para Power Virtual Agents.
O Azure OpenAI On Your Data agora oferece suporte a pontos de extremidade privados.
Capacidade de filtrar o acesso a documentos confidenciais.
Atualize automaticamente seu índice de acordo com uma programação.
Pesquisa vetorial e opções de pesquisa semântica.
Exibir seu histórico de bate-papo no aplicativo Web implantado

Julho de 2023

Suporte para chamada de função

O Azure OpenAI agora dá suporte à chamada de função para permitir que você trabalhe com funções na API de conclusão de chat.

Incorporação de aumento de matriz de entrada

O Azure OpenAI agora oferece suporte a matrizes com até 16 entradas por solicitação de API com text-embedding-ada-002 Versão 2.

Novas Regiões

O Azure OpenAI agora também está disponível nas regiões Leste do Canadá, Leste dos EUA 2, Leste do Japão e Centro-Norte dos EUA. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Junho de 2023

Usar o Azure OpenAI em seus próprios dados (visualização)

O Azure OpenAI On Your Data está agora disponível em pré-visualização, permitindo-lhe conversar com modelos OpenAI como GPT-35-Turbo e GPT-4 e receber respostas com base nos seus dados.

Novas versões dos modelos gpt-35-turbo e gpt-4

GPT-35-Turbo (Versão 0613)
GPT-35-Turbo-16K (Versão 0613)
GPT-4 (Versão 0613)
GPT-4-32K (Versão 0613)

Sul do Reino Unido

Azure OpenAI agora está disponível na região Sul do Reino Unido. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Filtragem de conteúdo e anotações (Pré-visualização)

Como configurar filtros de conteúdo com o Serviço Azure OpenAI.
Habilite as anotações para exibir informações de gravidade e categoria de filtragem de conteúdo como parte de suas chamadas de Conclusão de Chat e Conclusão de Chat baseadas em GPT.

Quota

A cota oferece a flexibilidade de gerenciar ativamente a alocação de limites de taxa nas implantações em sua assinatura.

Maio de 2023

Suporte a Java & JavaScript SDK

NOVOS SDKs de visualização do Azure OpenAI que oferecem suporte para JavaScript e Java.

Disponibilidade Geral (GA) de Conclusão do Chat OpenAI do Azure

Suporte de disponibilidade geral para:
- Versão da API 2023-05-15de conclusão do bate-papo .
- Modelos GPT-35-Turbo.
- Série de modelos GPT-4.

Se você estiver usando a 2023-03-15-preview API no momento, recomendamos migrar para a API do GA 2023-05-15 . Se você estiver usando a versão 2022-12-01 da API, essa API permanecerá GA, mas não incluirá os recursos mais recentes de Conclusão de Bate-papo.

Importante

O uso das versões atuais dos modelos GPT-35-Turbo com o ponto final de conclusão permanece em visualização.

França Central

Azure OpenAI agora está disponível na região França Central. Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade de modelos em cada região.

Abril de 2023

Visualização pública do DALL-E 2. O Serviço Azure OpenAI agora suporta APIs de geração de imagem alimentadas pelo modelo DALL-E 2 da OpenAI. Obtenha imagens geradas por IA com base no texto descritivo fornecido. Para saber mais, confira o guia de início rápido.
Implantações inativas de modelos personalizados agora serão excluídas após 15 dias; os modelos permanecerão disponíveis para reimplantação. Se um modelo personalizado (ajustado) for implantado por mais de quinze (15) dias durante os quais nenhuma conclusão ou chamada de conclusão de bate-papo for feita para ele, a implantação será excluída automaticamente (e nenhuma cobrança adicional de hospedagem será incorrida para essa implantação). O modelo personalizado subjacente permanecerá disponível e pode ser reimplantado a qualquer momento. Para saber mais, consulte o artigo de instruções.

Março de 2023

Os modelos da série GPT-4 estão agora disponíveis em pré-visualização no Azure OpenAI. Para solicitar acesso, os clientes existentes do Azure OpenAI podem se inscrever preenchendo este formulário. Estes modelos estão atualmente disponíveis nas regiões Leste dos EUA e Centro-Sul dos EUA.
Nova API de conclusão de bate-papo para modelos GPT-35-Turbo e GPT-4 lançada em pré-visualização em 21/03. Para saber mais, confira o artigo de início rápido e instruções atualizado.
Visualização GPT-35-Turbo. Para saber mais, confira o artigo de instruções.
Limites de treinamento aumentados para ajuste fino: O tamanho máximo do trabalho de treinamento (tokens no arquivo de treinamento) x (# de épocas) é de 2 bilhões de tokens para todos os modelos. Também aumentamos o trabalho máximo de treinamento de 120 para 720 horas.
Adicionar casos de uso adicionais ao seu acesso existente. Anteriormente, o processo de adição de novos casos de uso exigia que os clientes se recandidatassem ao serviço. Agora, estamos lançando um novo processo que permite que você adicione rapidamente novos casos de uso ao seu uso do serviço. Este processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure. Os clientes existentes podem atestar todos e quaisquer novos casos de uso aqui. Observe que isso é necessário sempre que você quiser usar o serviço para um novo caso de uso para o qual não se candidatou originalmente.

Fevereiro de 2023

Novos recursos

Exemplos de versão | de visualização do SDK do .NET (inferência)
Atualização do SDK do Terraform para dar suporte às operações de gerenciamento do Azure OpenAI.
A inserção de texto no final de uma conclusão agora é suportada com o suffix parâmetro.

Atualizações

A filtragem de conteúdo está ativada por padrão.

Novos artigos sobre:

Novo curso de formação:

Introdução ao Azure OpenAI

Janeiro de 2023

Novos recursos

Serviço GA. O Serviço Azure OpenAI agora está disponível para o público em geral.
Novos modelos: Adição do modelo de texto mais recente, text-davinci-003 (Leste dos EUA, Europa Ocidental), text-ada-embeddings-002 (Leste dos EUA, Centro-Sul dos EUA, Europa Ocidental)

Dezembro de 2022

Novas funcionalidades

Os modelos mais recentes da OpenAI. O Azure OpenAI fornece acesso a todos os modelos mais recentes, incluindo a série GPT-3.5.
Nova versão da API (2022-12-01). Esta atualização inclui vários aprimoramentos solicitados, incluindo informações de uso de token na resposta da API, mensagens de erro aprimoradas para arquivos, alinhamento com o OpenAI no ajuste fino da estrutura de dados de criação e suporte para o parâmetro de sufixo para permitir a nomeação personalizada de trabalhos ajustados.
Limites mais elevados de pedidos por segundo. 50 para modelos não Davinci. 20 para os modelos Davinci.
Implantações de ajuste fino mais rápidas. Implante modelos Ada e Curie ajustados em menos de 10 minutos.
Limites de treinamento mais altos: 40 milhões de tokens de treinamento para Ada, Babbage e Curie. 10M para Davinci.
Processo para solicitar modificações no abuso e registro de dados de uso incorreto ou revisão humana. Hoje, o serviço registra dados de solicitação/resposta para fins de deteção de abuso e uso indevido para garantir que esses modelos poderosos não sejam abusados. No entanto, muitos clientes têm requisitos rigorosos de privacidade e segurança de dados que exigem maior controle sobre seus dados. Para dar suporte a esses casos de uso, estamos lançando um novo processo para que os clientes modifiquem as políticas de filtragem de conteúdo ou desativem o log de abuso para casos de uso de baixo risco. Este processo segue o processo de Acesso Limitado estabelecido nos serviços de IA do Azure e os clientes OpenAI existentes podem candidatar-se aqui.
Criptografia de chave gerenciada pelo cliente (CMK). A CMK fornece aos clientes maior controle sobre o gerenciamento de seus dados no Azure OpenAI, fornecendo suas próprias chaves de criptografia usadas para armazenar dados de treinamento e modelos personalizados. As chaves geridas pelo cliente (CMK), também conhecidas como bring your own key (BYOK), oferecem maior flexibilidade para criar, rodar, desativar e revogar os controlos de acesso. Também pode auditar as chaves de encriptação utilizadas para proteger os dados. Saiba mais com a nossa documentação de encriptação em repouso.
Suporte a Lockbox
Conformidade com SOC-2
Registo e diagnóstico através das definições de Estado de Funcionamento dos Recursos do Azure, Análise de Custos e Métricas e Diagnóstico.
Melhorias no estúdio. Várias melhorias de usabilidade no fluxo de trabalho do Studio, incluindo suporte à função do Azure AD para controlar quem na equipe tem acesso para criar modelos ajustados e implantar.

Alterações (quebra)

O ajuste fino da solicitação de criação de API foi atualizado para corresponder ao esquema da OpenAI.

Pré-visualizar versões da API:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "hyperparams": { 
        "batch_size": 4,
        "learning_rate_multiplier": 0.1,
        "n_epochs": 4,
        "prompt_loss_weight": 0.1,
    }
}

API versão 2022-12-01:

{
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",
    "batch_size": 4,
    "learning_rate_multiplier": 0.1,
    "n_epochs": 4,
    "prompt_loss_weight": 0.1,
}

A filtragem de conteúdo está temporariamente desativada por padrão. A moderação de conteúdo do Azure funciona de forma diferente do Azure OpenAI. O Azure OpenAI executa filtros de conteúdo durante a chamada de geração para detetar conteúdo prejudicial ou abusivo e filtra-os da resposta. Saiba mais

Esses modelos serão reativados no 1º trimestre de 2023 e estarão ativados por padrão.

Ações do cliente

Entre em contato com o Suporte do Azure se quiser que eles sejam ativados para sua assinatura.
Solicite modificações de filtragem, se quiser que elas permaneçam desativadas. (Esta opção será apenas para casos de uso de baixo risco.)

Próximos passos

Saiba mais sobre os modelos subjacentes que alimentam o Azure OpenAI.

Partilhar via

O que há de novo no Serviço OpenAI do Azure

janeiro de 2025

O3-mini lançado

Conclusão de áudio GPT-4o

GPT-4o API em tempo real 2024-12-17

Dezembro de 2024

O1 Modelo de raciocínio liberado para acesso limitado

Disponibilidade da região

Ajuste fino de preferências (visualização)

Acabamentos armazenados e destilação

GPT-4o 2024-11-20

NOVO tipo de implantação provisionada de zona de dados

Novembro de 2024

Visão Ajuste fino GA

NOVO monitoramento de abuso de IA

Outubro de 2024

NOVO tipo de implantação padrão de zona de dados

Lote Global GA

Modelos O1-Preview e O1-mini de acesso limitado

Nova API GPT-4o em tempo real para pré-visualização pública de voz e áudio

Atualizações globais de suporte em lote

Setembro de 2024

Atualizações do Azure OpenAI Studio UX

Implantações provisionadas GPT-4o 2024-08-06

NOVO Tipo de implantação provisionada global

NOVOS modelos o1-preview e o1-mini disponíveis para acesso limitado

Principais capacidades da série o1

Variantes de modelo

Limitações

Segurança

Disponibilidade

Agosto de 2024

GPT-4o 2024-08-06 saídas estruturadas

Implantações provisionadas GPT-4o mini

Ajuste fino GPT-4o (Visualização pública)

Nova versão da API de pré-visualização

GPT-4o mini disponibilidade regional

Guia de avaliações

Último modelo GPT-4o disponível no parque infantil de acesso antecipado (pré-visualização)

Implantações globais em lote já estão disponíveis

Julho de 2024

GPT-4o mini já está disponível para ajuste fino

A ferramenta de pesquisa de arquivos Assistants agora é cobrada

Modelo mini GPT-4o disponível para implantação

Nova política de filtragem de conteúdo padrão de IA responsável

Nova versão da API do GA

Expansão das regiões disponíveis para implantações padrão globais do gpt-4o

junho de 2024

Atualizações da data de aposentadoria

Faturamento baseado em token para ajuste fino

GPT-4o lançado em novas regiões

Suporte de chave gerenciada pelo cliente (CMK) para assistentes

maio de 2024

Implantações provisionadas GPT-4o

Assistentes v2 (pré-visualização)

Disponibilidade geral (GA) do modelo GPT-4o

Tipo de implantação padrão global (visualização)

Atualizações de ajuste fino

Filtros de conteúdo configuráveis DALL-E e GPT-4 Turbo Vision GA

Filtro assíncrono disponível para todos os clientes do Azure OpenAI

Proteções do pedido

2024-05-01-preview Versão da API

Disponibilidade geral do modelo GPT-4 Turbo (GA)

Diferenças entre OpenAI e Azure OpenAI GPT-4 Turbo GA Models

Diferenças do gpt-4 vision-preview

Disponibilidade gerenciada provisionada GPT-4 Turbo

Implantando o GPT-4 Turbo com o Vision GA

Abril de 2024

O ajuste fino agora é suportado em duas novas regiões Leste dos EUA 2 e Suíça Oeste

E.U.A. Leste 2

Oeste da Suíça

Exemplos de treinamento de bate-papo em vários turnos

O GPT-4 (0125) está disponível para o Azure OpenAI On Your Data

Março de 2024

Riscos e monitoramento de segurança no Azure OpenAI Studio

Azure OpenAI em suas atualizações de dados

2024-02-01 Lançada a API de disponibilidade geral (GA)

Sussurrar disponibilidade geral (GA)

Disponibilidade geral do DALL-E 3 (GA)