Linguagens de programação compatíveis com o OpenAI do Azure

A biblioteca de clientes do OpenAI do Azure para .NET é um complemento para a biblioteca de clientes do OpenAI oficial para .NET. A biblioteca do OpenAI do Azure configura um cliente para uso com o OpenAI do Azure e fornece suporte extra de extensão fortemente tipado para modelos de solicitação e resposta específicos para cenários do OpenAI do Azure.

Versão estável:

Código-fonte | Pacote (NuGet) | Documentação de referência do pacoteDocumentação de referência da API | Exemplos

Versão prévia:

A versão prévia tem acesso aos recursos mais recentes.

Código-fonte | Pacote (NuGet) | Documentação de referência de API | Documentação de referência do pacoteExemplos

Suporte à versão da API do OpenAI do Azure

Ao contrário das bibliotecas de clientes do OpenAI do Azure para Python e JavaScript, o pacote .NET do OpenAI do Azure está limitado a direcionar um subconjunto específico das versões da API do OpenAI do Azure. Geralmente, cada pacote .NET do OpenAI do Azure desbloqueia o acesso aos recursos mais recentes de versão da API do OpenAI do Azure. Ter acesso às versões mais recentes da API afeta a disponibilidade do recurso.

A seleção de versão é controlada pela enumeração AzureOpenAIClientOptions.ServiceVersion.

A versão estável atualmente tem como destino:


No momento, a versão prévia pode ser direcionada a:

  • 2024-06-01
  • 2024-08-01-preview
  • 2024-09-01-preview
  • 2024-10-01-preview


dotnet add package Azure.AI.OpenAI --prerelease

O pacote Azure.AI.OpenAI se baseia no pacote oficial do OpenAI, que é incluído como uma dependência.


Para interagir com o OpenAI do Azure ou o OpenAI, crie uma instância de AzureOpenAIClient com uma das seguintes abordagens:

Uma abordagem de autenticação segura e sem chave é usar o Microsoft Entra ID (antigo Azure Active Directory) por meio da Biblioteca de Identidade do Azure. Para usar a biblioteca:

dotnet add package Azure.Identity

Use o tipo de credencial desejado da biblioteca. Por exemplo DefaultAzureCredential:

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-mini-deployment");

Para obter mais informações sobre a autenticação sem chave do OpenAI do Azure, confira o artigo de início rápido "Comece a usar o bloco de construção de segurança do OpenAI do Azure".




AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

AudioClient client = openAIClient.GetAudioClient("whisper");

string audioFilePath = Path.Combine("Assets", "speech.mp3");

AudioTranscriptionOptions options = new()
    ResponseFormat = AudioTranscriptionFormat.Verbose,
    TimestampGranularities = AudioTimestampGranularities.Word | AudioTimestampGranularities.Segment,

AudioTranscription transcription = client.TranscribeAudio(audioFilePath, options);


foreach (TranscribedWord word in transcription.Words)
    Console.WriteLine($"  {word.Word,15} : {word.StartTime.TotalMilliseconds,5:0} - {word.EndTime.TotalMilliseconds,5:0}");

foreach (TranscribedSegment segment in transcription.Segments)
    Console.WriteLine($"  {segment.Text,90} : {segment.StartTime.TotalMilliseconds,5:0} - {segment.EndTime.TotalMilliseconds,5:0}");

Conversão de Texto em Fala (TTS)

using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Audio;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

AudioClient client = openAIClient.GetAudioClient("tts-hd"); //Replace with your Azure OpenAI model deployment

string input = "Testing, testing, 1, 2, 3";

BinaryData speech = client.GenerateSpeech(input, GeneratedSpeechVoice.Alloy);

using FileStream stream = File.OpenWrite($"{Guid.NewGuid()}.mp3");



AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-deployment");

ChatCompletion completion = chatClient.CompleteChat(
        // System messages represent instructions or other guidance about how the assistant should behave
        new SystemChatMessage("You are a helpful assistant that talks like a pirate."),
        // User messages represent user input, whether historical or the most recent input
        new UserChatMessage("Hi, can you help me?"),
        // Assistant messages in a request represent conversation history for responses
        new AssistantChatMessage("Arrr! Of course, me hearty! What can I do for ye?"),
        new UserChatMessage("What's the best way to train a parrot?"),

Console.WriteLine($"{completion.Role}: {completion.Content[0].Text}");

Transmitir mensagens de chat

As conclusões de chat de streaming usam os métodos CompleteChatStreaming e CompleteChatStreamingAsync, que retornam um ResultCollection<StreamingChatCompletionUpdate> ou AsyncCollectionResult<StreamingChatCompletionUpdate> em vez de um ClientResult<ChatCompletion>.

Essas coleções de resultados podem ser iteradas usando foreach ou await foreach, com cada atualização chegando à medida que novos dados são disponibilizados na resposta transmitida.

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());
ChatClient chatClient = openAIClient.GetChatClient("my-gpt-4o-deployment");

CollectionResult<StreamingChatCompletionUpdate> completionUpdates = chatClient.CompleteChatStreaming(
        new SystemChatMessage("You are a helpful assistant that talks like a pirate."),
        new UserChatMessage("Hi, can you help me?"),
        new AssistantChatMessage("Arrr! Of course, me hearty! What can I do for ye?"),
        new UserChatMessage("What's the best way to train a parrot?"),

foreach (StreamingChatCompletionUpdate completionUpdate in completionUpdates)
    foreach (ChatMessageContentPart contentPart in completionUpdate.ContentUpdate)



using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Embeddings;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

EmbeddingClient client = openAIClient.GetEmbeddingClient("text-embedding-3-large"); //Replace with your model deployment name

string description = "This is a test embedding";

OpenAIEmbedding embedding = client.GenerateEmbedding(description);
ReadOnlyMemory<float> vector = embedding.ToFloats();

Console.WriteLine(string.Join(", ", vector.ToArray()));

Ajuste fino

Atualmente, não há suporte para os pacotes .NET do OpenAI do Azure.


Atualmente, não há suporte para os pacotes .NET do OpenAI do Azure.



using Azure.AI.OpenAI;
using Azure.Identity;
using OpenAI.Images;

AzureOpenAIClient openAIClient = new(
    new Uri(""),
    new DefaultAzureCredential());

ImageClient client = openAIClient.GetImageClient("dall-e-3"); // replace with your model deployment name.

string prompt = "A rabbit eating pancakes.";

ImageGenerationOptions options = new()
     Quality = GeneratedImageQuality.High,
     Size = GeneratedImageSize.W1792xH1024,
     Style = GeneratedImageStyle.Vivid,
     ResponseFormat = GeneratedImageFormat.Bytes

GeneratedImage image = client.GenerateImage(prompt, options);
BinaryData bytes = image.ImageBytes;

using FileStream stream = File.OpenWrite($"{Guid.NewGuid()}.png");

Conclusões (herdadas)

Não há suporte para os pacotes .NET do OpenAI do Azure.

Tratamento de erros

Códigos do Erro

Código do Status Tipo de erro
400 Bad Request Error
401 Authentication Error
403 Permission Denied Error
404 Not Found Error
422 Unprocessable Entity Error
429 Rate Limit Error
500 Internal Server Error
503 Service Unavailable
504 Gateway Timeout

Novas tentativas

As classes cliente repetirão automaticamente os seguintes erros até três vezes mais usando a retirada exponencial:

  • 408 Tempo Limite da Solicitação
  • 429 Excesso de Solicitações
  • Erro interno de servidor 500
  • 502 Gateway Incorreto
  • 503 Serviço Indisponível
  • 504 Tempo Limite do Gateway

Código-fonte | Pacote ( | Documentação de referência de API | Documentação de referência de pacoteExemplos

Suporte à versão da API do OpenAI do Azure

Ao contrário das bibliotecas de clientes do OpenAI do Azure para Python e JavaScript, a biblioteca do OpenAI do Azure Go é direcionada a uma versão específica da API do OpenAI do Azure. Ter acesso às versões mais recentes da API afeta a disponibilidade do recurso.

Destino da versão atual da API do OpenAI do Azure: 2024-10-01-preview

Isso é definido no arquivo custom_client.go.


Instale os módulos azopenai e azidentity com go get:

go get

# optional
go get


O módulo azidentity é usado para autenticação do Azure Active Directory com o Azure OpenAI.

package main

import (


func main() {
	dac, err := azidentity.NewDefaultAzureCredential(nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// NOTE: this constructor creates a client that connects to an Azure OpenAI endpoint.
	// To connect to the public OpenAI endpoint, use azopenai.NewClientForOpenAI
	client, err := azopenai.NewClient("https://<your-azure-openai-host>", dac, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	_ = client

Para obter mais informações sobre a autenticação sem chave do OpenAI do Azure, confira Usar o OpenAI do Azure sem chaves.



ackage main

import (


func main() {
	openAIKey := os.Getenv("OPENAI_API_KEY")

	// Ex: ""
	openAIEndpoint := os.Getenv("OPENAI_ENDPOINT")

	modelDeploymentID := "tts-1"

	if openAIKey == "" || openAIEndpoint == "" || modelDeploymentID == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(openAIKey)

	client, err := azopenai.NewClientForOpenAI(openAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	audioResp, err := client.GenerateSpeechFromText(context.Background(), azopenai.SpeechGenerationOptions{
		Input:          to.Ptr("i am a computer"),
		Voice:          to.Ptr(azopenai.SpeechVoiceAlloy),
		ResponseFormat: to.Ptr(azopenai.SpeechGenerationResponseFormatFlac),
		DeploymentName: to.Ptr("tts-1"),
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	defer audioResp.Body.Close()

	audioBytes, err := io.ReadAll(audioResp.Body)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	fmt.Fprintf(os.Stderr, "Got %d bytes of FLAC audio\n", len(audioBytes))



package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_WHISPER_API_KEY")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_WHISPER_ENDPOINT")

	modelDeploymentID := os.Getenv("AOAI_WHISPER_MODEL")

	if azureOpenAIKey == "" || azureOpenAIEndpoint == "" || modelDeploymentID == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	mp3Bytes, err := os.ReadFile("testdata/sampledata_audiofiles_myVoiceIsMyPassportVerifyMe01.mp3")

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetAudioTranscription(context.TODO(), azopenai.AudioTranscriptionOptions{
		File: mp3Bytes,

		// this will return _just_ the translated text. Other formats are available, which return
		// different or additional metadata. See [azopenai.AudioTranscriptionFormat] for more examples.
		ResponseFormat: to.Ptr(azopenai.AudioTranscriptionFormatText),

		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	fmt.Fprintf(os.Stderr, "Transcribed text: %s\n", *resp.Text)




package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_CHAT_COMPLETIONS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_CHAT_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_CHAT_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// This is a conversation in progress.
	// NOTE: all messages, regardless of role, count against token usage for this API.
	messages := []azopenai.ChatRequestMessageClassification{
		// You set the tone and rules of the conversation with a prompt as the system role.
		&azopenai.ChatRequestSystemMessage{Content: azopenai.NewChatRequestSystemMessageContent("You are a helpful assistant. You will talk like a pirate.")},

		// The user asks a question
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("Can you help me?")},

		// The reply would come back from the ChatGPT. You'd add it to the conversation so we can maintain context.
		&azopenai.ChatRequestAssistantMessage{Content: azopenai.NewChatRequestAssistantMessageContent("Arrrr! Of course, me hearty! What can I do for ye?")},

		// The user answers the question based on the latest reply.
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("What's the best way to train a parrot?")},

		// from here you'd keep iterating, sending responses back from ChatGPT

	gotReply := false

	resp, err := client.GetChatCompletions(context.TODO(), azopenai.ChatCompletionsOptions{
		// This is a conversation in progress.
		// NOTE: all messages count against token usage for this API.
		Messages:       messages,
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, choice := range resp.Choices {
		gotReply = true

		if choice.ContentFilterResults != nil {
			fmt.Fprintf(os.Stderr, "Content filter results\n")

			if choice.ContentFilterResults.Error != nil {
				fmt.Fprintf(os.Stderr, "  Error:%v\n", choice.ContentFilterResults.Error)

			fmt.Fprintf(os.Stderr, "  Hate: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Hate.Severity, *choice.ContentFilterResults.Hate.Filtered)
			fmt.Fprintf(os.Stderr, "  SelfHarm: sev: %v, filtered: %v\n", *choice.ContentFilterResults.SelfHarm.Severity, *choice.ContentFilterResults.SelfHarm.Filtered)
			fmt.Fprintf(os.Stderr, "  Sexual: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Sexual.Severity, *choice.ContentFilterResults.Sexual.Filtered)
			fmt.Fprintf(os.Stderr, "  Violence: sev: %v, filtered: %v\n", *choice.ContentFilterResults.Violence.Severity, *choice.ContentFilterResults.Violence.Filtered)

		if choice.Message != nil && choice.Message.Content != nil {
			fmt.Fprintf(os.Stderr, "Content[%d]: %s\n", *choice.Index, *choice.Message.Content)

		if choice.FinishReason != nil {
			// this choice's conversation is complete.
			fmt.Fprintf(os.Stderr, "Finish reason[%d]: %s\n", *choice.Index, *choice.FinishReason)

	if gotReply {
		fmt.Fprintf(os.Stderr, "Got chat completions reply\n")



package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_CHAT_COMPLETIONS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_CHAT_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_CHAT_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	// This is a conversation in progress.
	// NOTE: all messages, regardless of role, count against token usage for this API.
	messages := []azopenai.ChatRequestMessageClassification{
		// You set the tone and rules of the conversation with a prompt as the system role.
		&azopenai.ChatRequestSystemMessage{Content: azopenai.NewChatRequestSystemMessageContent("You are a helpful assistant. You will talk like a pirate and limit your responses to 20 words or less.")},

		// The user asks a question
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("Can you help me?")},

		// The reply would come back from the ChatGPT. You'd add it to the conversation so we can maintain context.
		&azopenai.ChatRequestAssistantMessage{Content: azopenai.NewChatRequestAssistantMessageContent("Arrrr! Of course, me hearty! What can I do for ye?")},

		// The user answers the question based on the latest reply.
		&azopenai.ChatRequestUserMessage{Content: azopenai.NewChatRequestUserMessageContent("What's the best way to train a parrot?")},

		// from here you'd keep iterating, sending responses back from ChatGPT

	resp, err := client.GetChatCompletionsStream(context.TODO(), azopenai.ChatCompletionsStreamOptions{
		// This is a conversation in progress.
		// NOTE: all messages count against token usage for this API.
		Messages:       messages,
		N:              to.Ptr[int32](1),
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	defer resp.ChatCompletionsStream.Close()

	gotReply := false

	for {
		chatCompletions, err := resp.ChatCompletionsStream.Read()

		if errors.Is(err, io.EOF) {

		if err != nil {
			//  TODO: Update the following line with your application specific error handling logic
			log.Printf("ERROR: %s", err)

		for _, choice := range chatCompletions.Choices {
			gotReply = true

			text := ""

			if choice.Delta.Content != nil {
				text = *choice.Delta.Content

			role := ""

			if choice.Delta.Role != nil {
				role = string(*choice.Delta.Role)

			fmt.Fprintf(os.Stderr, "Content[%d], role %q: %q\n", *choice.Index, role, text)

	if gotReply {
		fmt.Fprintf(os.Stderr, "Got chat completions streaming reply\n")




package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_EMBEDDINGS_API_KEY")
	modelDeploymentID := os.Getenv("AOAI_EMBEDDINGS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_EMBEDDINGS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeploymentID == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetEmbeddings(context.TODO(), azopenai.EmbeddingsOptions{
		Input:          []string{"Testing, testing, 1,2,3."},
		DeploymentName: &modelDeploymentID,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, embed := range resp.Data {
		// embed.Embedding contains the embeddings for this input index.
		fmt.Fprintf(os.Stderr, "Got embeddings for input %d\n", *embed.Index)


Geração de imagem


package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_DALLE_API_KEY")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_DALLE_ENDPOINT")

	azureDeployment := os.Getenv("AOAI_DALLE_MODEL")

	if azureOpenAIKey == "" || azureOpenAIEndpoint == "" || azureDeployment == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetImageGenerations(context.TODO(), azopenai.ImageGenerationOptions{
		Prompt:         to.Ptr("a cat"),
		ResponseFormat: to.Ptr(azopenai.ImageGenerationResponseFormatURL),
		DeploymentName: &azureDeployment,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, generatedImage := range resp.Data {
		// the underlying type for the generatedImage is dictated by the value of
		// ImageGenerationOptions.ResponseFormat. In this example we used `azopenai.ImageGenerationResponseFormatURL`,
		// so the underlying type will be ImageLocation.

		resp, err := http.Head(*generatedImage.URL)

		if err != nil {
			// TODO: Update the following line with your application specific error handling logic
			log.Printf("ERROR: %s", err)

		_ = resp.Body.Close()
		fmt.Fprintf(os.Stderr, "Image generated, HEAD request on URL returned %d\n", resp.StatusCode)


Conclusões (herdadas)


package main

import (


func main() {
	azureOpenAIKey := os.Getenv("AOAI_COMPLETIONS_API_KEY")
	modelDeployment := os.Getenv("AOAI_COMPLETIONS_MODEL")

	// Ex: "https://<your-azure-openai-host>"
	azureOpenAIEndpoint := os.Getenv("AOAI_COMPLETIONS_ENDPOINT")

	if azureOpenAIKey == "" || modelDeployment == "" || azureOpenAIEndpoint == "" {
		fmt.Fprintf(os.Stderr, "Skipping example, environment variables missing\n")

	keyCredential := azcore.NewKeyCredential(azureOpenAIKey)

	// In Azure OpenAI you must deploy a model before you can use it in your client. For more information
	// see here:
	client, err := azopenai.NewClientWithKeyCredential(azureOpenAIEndpoint, keyCredential, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	resp, err := client.GetCompletions(context.TODO(), azopenai.CompletionsOptions{
		Prompt:         []string{"What is Azure OpenAI, in 20 words or less"},
		MaxTokens:      to.Ptr(int32(2048)),
		Temperature:    to.Ptr(float32(0.0)),
		DeploymentName: &modelDeployment,
	}, nil)

	if err != nil {
		// TODO: Update the following line with your application specific error handling logic
		log.Printf("ERROR: %s", err)

	for _, choice := range resp.Choices {
		fmt.Fprintf(os.Stderr, "Result: %s\n", *choice.Text)


Tratamento de erros

Todos os métodos que enviam solicitações HTTP retornam *azcore.ResponseError quando essas solicitações falham. ResponseError tem detalhes de erro e a resposta bruta do serviço.


Este módulo usa a implementação de log no azcore. Para ativar o log de todos os módulos do SDK do Azure, defina AZURE_SDK_GO_LOGGING para todos. Por padrão, o agente grava no stderr. Use o pacote azcore/log para controlar a saída do log. Por exemplo, registrar somente eventos de solicitação e resposta HTTP e imprimi-los para stdout:

import azlog ""

// Print log events to stdout
azlog.SetListener(func(cls azlog.Event, msg string) {

// Includes only requests and responses in credential logs
azlog.SetEvents(azlog.EventRequest, azlog.EventResponse)

Código-fonte | Artefato (Maven) | Documentação de referência de API | Documentação de referência do pacoteExemplos

Suporte à versão da API do OpenAI do Azure

Ao contrário das bibliotecas de clientes do OpenAI do Azure para Python e JavaScript, para garantir a compatibilidade, o pacote Java do OpenAI do Azure está limitado a direcionar um subconjunto específico das versões da API do OpenAI do Azure. Geralmente, cada pacote Java do OpenAI do Azure desbloqueia o acesso aos recursos mais recentes de versão da API do OpenAI do Azure. Ter acesso às versões mais recentes da API afeta a disponibilidade do recurso.

A seleção de versão é controlada pela enumeração OpenAIServiceVersion.

A API de versão prévia mais recente do OpenAI do Azure com suporte é:


A versão mais recente estável (GA) com suporte é:



Detalhes do pacote



Para interagir com o Serviço OpenAI do Azure, você precisará criar uma instância da classe cliente, OpenAIAsyncClient ou OpenAIClient usando OpenAIClientBuilder. Para configurar um cliente para uso com o OpenAI do Azure, forneça um URI de ponto de extremidade válido para um recurso do OpenAI do Azure, juntamente com uma credencial de chave correspondente, credencial de token ou credencial de Identidade do Azure que está autorizada a usar o recurso do OpenAI do Azure.

A autenticação com a ID do Microsoft Entra requer alguma configuração inicial:

Adicione o pacote de Identidade do Azure:


Após a instalação, você pode escolher qual tipo de credencial de azure.identity usar. Por exemplo, DefaultAzureCredential pode ser usado para autenticar o cliente: defina os valores da ID do cliente, da ID do locatário e do segredo do cliente do aplicativo do Microsoft Entra ID como variáveis de ambiente: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

A autorização é mais fácil usando DefaultAzureCredential. Ele encontra a melhor credencial a ser usada em seu ambiente em execução.

TokenCredential defaultCredential = new DefaultAzureCredentialBuilder().build();
OpenAIClient client = new OpenAIClientBuilder()

Para obter mais informações sobre a autenticação sem chave do OpenAI do Azure, confira Usar o OpenAI do Azure sem chaves.



String fileName = "{your-file-name}";
Path filePath = Paths.get("{your-file-path}" + fileName);

byte[] file = BinaryData.fromFile(filePath).toBytes();
AudioTranscriptionOptions transcriptionOptions = new AudioTranscriptionOptions(file)

AudioTranscription transcription = client.getAudioTranscription("{deploymentOrModelName}", fileName, transcriptionOptions);

System.out.println("Transcription: " + transcription.getText());


Conversão de texto em fala (TTS)

String deploymentOrModelId = "{azure-open-ai-deployment-model-id}";
SpeechGenerationOptions options = new SpeechGenerationOptions(
        "Today is a wonderful day to build something people love!",
BinaryData speech = client.generateSpeechFromText(deploymentOrModelId, options);
// Checkout your generated speech in the file system.
Path path = Paths.get("{your-local-file-path}/speech.wav");
Files.write(path, speech.toBytes());



List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
    new ChatCompletionsOptions(chatMessages));

System.out.printf("Model ID=%s is created at %s.%n", chatCompletions.getId(), chatCompletions.getCreatedAt());
for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.printf("Index: %d, Chat Role: %s.%n", choice.getIndex(), message.getRole());


List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
    new ChatCompletionsOptions(chatMessages));

System.out.printf("Model ID=%s is created at %s.%n", chatCompletions.getId(), chatCompletions.getCreatedAt());
for (ChatChoice choice : chatCompletions.getChoices()) {
    ChatResponseMessage message = choice.getMessage();
    System.out.printf("Index: %d, Chat Role: %s.%n", choice.getIndex(), message.getRole());

Conclusões de chat com imagens

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant that describes images"));
chatMessages.add(new ChatRequestUserMessage(Arrays.asList(
        new ChatMessageTextContentItem("Please describe this image"),
        new ChatMessageImageContentItem(
                new ChatMessageImageUrl(""))

ChatCompletionsOptions chatCompletionsOptions = new ChatCompletionsOptions(chatMessages);
ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}", chatCompletionsOptions);

System.out.println("Chat completion: " + chatCompletions.getChoices().get(0).getMessage().getContent());



EmbeddingsOptions embeddingsOptions = new EmbeddingsOptions(
    Arrays.asList("Your text string goes here"));

Embeddings embeddings = client.getEmbeddings("{deploymentOrModelName}", embeddingsOptions);

for (EmbeddingItem item : embeddings.getData()) {
    System.out.printf("Index: %d.%n", item.getPromptIndex());
    for (Float embedding : item.getEmbedding()) {
        System.out.printf("%f;", embedding);

Geração de imagem

ImageGenerationOptions imageGenerationOptions = new ImageGenerationOptions(
    "A drawing of the Seattle skyline in the style of Van Gogh");
ImageGenerations images = client.getImageGenerations("{deploymentOrModelName}", imageGenerationOptions);

for (ImageGenerationData imageGenerationData : images.getData()) {
        "Image location URL that provides temporary access to download the generated image is %s.%n",

Tratar erros

Habilitar o log do cliente

Para solucionar problemas com a biblioteca do OpenAI do Azure, é importante primeiro habilitar o registro em log para monitorar o comportamento do aplicativo. Os erros e avisos nos logs geralmente fornecem insights úteis sobre o que deu errado e, às vezes, incluem ações corretivas para corrigir problemas. As bibliotecas de clientes do Azure para Java têm duas opções de registro em log:

  • Uma estrutura de registro em log interna.
  • Suporte para registro em log usando a interface do SLF4J.

Confira as instruções neste documento de referência sobre como [configurar o registro em log no SDK do Azure para Java][logging_overview].

Habilitar registro em log de solicitação/resposta HTTP

A revisão da solicitação HTTP enviada ou da resposta recebida pela transmissão de/para o Serviço OpenAI do Azure pode ser útil para solucionar problemas. Para habilitar o registro em log da solicitação HTTP e do conteúdo de resposta, o [OpenAIClient][openai_client] pode ser configurado conforme mostrado abaixo. Se não houver SLF4J no caminho da classe Logger, defina uma variável de ambiente [AZURE_LOG_LEVEL][azure_log_level] em seu computador para habilitar o registro em log.

OpenAIClient openAIClient = new OpenAIClientBuilder()
        .credential(new AzureKeyCredential("{key}"))
        .httpLogOptions(new HttpLogOptions().setLogLevel(HttpLogDetailLevel.BODY_AND_HEADERS))
// or
DefaultAzureCredential credential = new DefaultAzureCredentialBuilder().build();
OpenAIClient configurationClientAad = new OpenAIClientBuilder()
        .httpLogOptions(new HttpLogOptions().setLogLevel(HttpLogDetailLevel.BODY_AND_HEADERS))

Como alternativa, você pode configurar solicitações HTTP de log e respostas para todo o aplicativo definindo a variável de ambiente a seguir. Observe que esta alteração habilitará o registro em log para cada cliente do Azure que dá suporte ao registro em log de solicitação/resposta HTTP.

Nome da variável de ambiente: AZURE_HTTP_LOG_DETAIL_LEVEL

Valor Nível de log
nenhum O log de solicitação/resposta HTTP está desabilitado
básico Registra somente URLs, métodos HTTP e tempo para concluir a solicitação.
headers Registra tudo em BASIC, além de todos os cabeçalhos de solicitação e resposta.
body Registra tudo em BASIC, além de todo o corpo da solicitação e da resposta.
body_and_headers Registra tudo em CABEÇALHOS e CORPO.


Ao registrar em log o corpo da solicitação e da resposta, certifique-se de que elas não contenham informações confidenciais. Ao registrar cabeçalhos em log, a biblioteca de clientes tem um conjunto padrão de cabeçalhos que são considerados seguros para registro em log, mas esse conjunto pode ser atualizado atualizando as opções de log no construtor, conforme mostrado abaixo.

clientBuilder.httpLogOptions(new HttpLogOptions().addAllowedHeaderName("safe-to-log-header-name"))

Solução de problemas de exceções

Os métodos do Serviço OpenAI do Azure lançam uma[HttpResponseException ou sua subclasse em caso de falha. O HttpResponseException gerado pela biblioteca de clientes OpenAI inclui um objeto de erro de resposta detalhado que fornece insights úteis específicos sobre o que deu errado e inclui ações para corrigir problemas comuns. Essas informações de erro podem ser encontradas dentro da propriedade de mensagem do objeto HttpResponseException.

Aqui está o exemplo de como capturar isso com um cliente síncrono

List<ChatRequestMessage> chatMessages = new ArrayList<>();
chatMessages.add(new ChatRequestSystemMessage("You are a helpful assistant. You will talk like a pirate."));
chatMessages.add(new ChatRequestUserMessage("Can you help me?"));
chatMessages.add(new ChatRequestAssistantMessage("Of course, me hearty! What can I do for ye?"));
chatMessages.add(new ChatRequestUserMessage("What's the best way to train a parrot?"));

try {
    ChatCompletions chatCompletions = client.getChatCompletions("{deploymentOrModelName}",
            new ChatCompletionsOptions(chatMessages));
} catch (HttpResponseException e) {
    // Do something with the exception

Com clientes assíncronos, você pode capturar e manipular exceções nos retornos de chamada de erro:

asyncClient.getChatCompletions("{deploymentOrModelName}", new ChatCompletionsOptions(chatMessages))
        .doOnSuccess(ignored -> System.out.println("Success!"))
                error -> error instanceof ResourceNotFoundException,
                error -> System.out.println("Exception: 'getChatCompletions' could not be performed."));

Erros de autenticação

O OpenAI do Azure dá suporte à autenticação da ID do Microsoft Entra. OpenAIClientBuilder tem o método para definir o credential. Para fornecer uma credencial válida, você pode usar a dependência azure-identity.

Código-fonte | Pacote (npm) | Referência |

Suporte à versão da API do OpenAI do Azure

A disponibilidade de recursos no Azure OpenAI depende de qual versão da API REST você tem como destino. Para os recursos mais recentes, tenha a API em versão prévia mais recente como destino.

API em disponibilidade geral mais recente API em versão prévia mais recente
2024-10-21 2025-01-01-preview


npm install openai


Há várias maneiras de autenticar com o serviço OpenAI do Azure usando tokens de Microsoft Entra ID. A maneira padrão é usar a classe DefaultAzureCredential do pacote @azure/identity.

import { DefaultAzureCredential } from "@azure/identity";
const credential = new DefaultAzureCredential();

Em seguida, esse objeto é passado como parte do objeto AzureClientOptions para os construtores cliente AzureOpenAI e AssistantsClient.

No entanto, para autenticar o cliente AzureOpenAI, precisamos usar a função getBearerTokenProvider do pacote @azure/identity. Essa função cria um provedor de token que usa AzureOpenAI internamente para obter tokens para cada solicitação. O provedor de token é criado da seguinte maneira:

import { AzureOpenAI } from 'openai';
import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
const credential = new DefaultAzureCredential();
const endpoint = "";
const apiVersion = "2024-10-21"
const scope = "";
const azureADTokenProvider = getBearerTokenProvider(credential, scope);
const deployment = "gpt-35-turbo";

const client = new AzureOpenAI({ 

Para obter mais informações sobre a autenticação sem chave do OpenAI do Azure, confira o artigo de início rápido "Comece a usar o bloco de construção de segurança do OpenAI do Azure".


O objeto AzureClientOptions estende o objeto ClientOptions do OpenAI. Esse objeto cliente específico do Azure é usado para configurar a conexão e o comportamento do cliente do OpenAI do Azure. Inclui propriedades para especificar as propriedades exclusivas para o Azure.

Propriedade Detalhes
apiVersion: string Especifica a versão da API a ser usada.
azureADTokenProvider: (() => Promise<string>) Uma função que retorna um token de acesso para o Microsoft Entra (anteriormente conhecido como Azure Active Directory), invocado em cada solicitação.
implantação: string Um modelo de implantação. Se fornecido, define o URL do cliente base para incluir /deployments/{deployment}. Os pontos de extremidade que não são de implantação não podem ser usados (sem suporte com APIs de Assistentes).
ponto de extremidade: string Seu ponto de extremidade do OpenAI do Azure com o seguinte formato:



import { createReadStream } from "fs";

const result = await{
  model: '',
  file: createReadStream(audioFilePath),



const result = await{ messages, model: '', max_tokens: 100 });


const stream = await{ model: '', messages, max_tokens: 100, stream: true });


const embeddings = await client.embeddings.create({ input, model: '' });

Geração de imagem

  const results = await client.images.generate({ prompt, model: '', n, size });

Tratamento de erros

Códigos do Erro

Código do Status Tipo de erro
400 Bad Request Error
401 Authentication Error
403 Permission Denied Error
404 Not Found Error
422 Unprocessable Entity Error
429 Rate Limit Error
500 Internal Server Error
503 Service Unavailable
504 Gateway Timeout

Novas tentativas

Os seguintes erros são desativados automaticamente duas vezes por padrão com uma breve retirada exponencial:

  • Erros de conexão
  • 408 Tempo Limite da Solicitação
  • 429 Limite de Taxa
  • >=Erros internos 500

Use maxRetries para definir/desabilitar o comportamento de repetição:

// Configure the default for all requests:
const client = new AzureOpenAI({
  maxRetries: 0, // default is 2

// Or, configure per-request:
await{ messages: [{ role: 'user', content: 'How can I get the name of the current day in Node.js?' }], model: '' }, {
  maxRetries: 5,

Código-fonte da biblioteca | Pacote (PyPi) | Referência |


Essa biblioteca é mantida pelo OpenAI. Consulte o histórico de lançamentos para acompanhar as atualizações mais recentes na biblioteca.

Suporte à versão da API do OpenAI do Azure

A disponibilidade de recursos no Azure OpenAI depende de qual versão da API REST você tem como destino. Para os recursos mais recentes, tenha a API em versão prévia mais recente como destino.

API em disponibilidade geral mais recente API em versão prévia mais recente
2024-10-21 2025-01-01-preview


pip install openai

Para a última versão:

pip install openai --upgrade


import os
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), ""

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 

Para obter mais informações sobre a autenticação sem chave do OpenAI do Azure, confira o artigo de início rápido "Comece a usar o bloco de construção de segurança do OpenAI do Azure".



Atualmente, esta função requer uma versão prévia da API.

Defina api_version="2024-10-01-preview" para usar esta função.

# from openai import AzureOpenAI
# client = AzureOpenAI()

from pathlib import Path
import os

speech_file_path = Path("speech.mp3")

response =
  model="tts-hd", #Replace with model deployment name
  input="Testing, testing, 1,2,3."


# from openai import AzureOpenAI
# client = AzureOpenAI()

audio_file = open("speech1.mp3", "rb")
transcript =
  model="whisper", # Replace with model deployment name




# from openai import AzureOpenAI
# client = AzureOpenAI()

completion =
  model="gpt-4o", # Replace with your model dpeloyment name.
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "When was Microsoft founded?"}


chat.completions.create() - streaming

# from openai import AzureOpenAI
# client = AzureOpenAI()

completion =
  model="gpt-4o", # Replace with your model dpeloyment name.
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "When was Microsoft founded?"}

for chunk in completion:
    if chunk.choices and chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end='',)

chat.completions.create() - entrada de imagem

completion =
            "role": "user",
            "content": [
                {"type": "text", "text": "What's in this image?"},
                    "type": "image_url",
                    "image_url": {
                        "url": "",




# from openai import AzureOpenAI
# client = AzureOpenAI()

embedding = client.embeddings.create(
  model="text-embedding-3-large", # Replace with your model deployment name
  input="Attenion is all you need",


Ajuste fino

Ajuste fino com o artigo de instruções do Python


Artigo de instruções do Lote com Python



# from openai import AzureOpenAI
# client = AzureOpenAI()

generate_image = client.images.generate(
  model="dall-e-3", #replace with your model deployment name
  prompt="A rabbit eating pancakes",
  quality = "hd",
  response_format = "url",
  style = "vivid"


Conclusões (herdadas)


# from openai import AzureOpenAI
# client = AzureOpenAI()

legacy_completion = client.completions.create(
  model="gpt-35-turbo-instruct", # Replace with model deployment name
  prompt="Hello World!",


Tratamento de erros

# from openai import AzureOpenAI
# client = AzureOpenAI()

import openai

except openai.APIConnectionError as e:
    print("The server could not be reached")
    print(e.__cause__)  # an underlying Exception, likely raised within httpx.
except openai.RateLimitError as e:
    print("A 429 status code was received; we should back off a bit.")
except openai.APIStatusError as e:
    print("Another non-200-range status code was received")

Códigos do Erro

Código do Status Tipo de erro
400 BadRequestError
401 AuthenticationError
403 PermissionDeniedError
404 NotFoundError
422 UnprocessableEntityError
429 RateLimitError
>=500 InternalServerError
N/D APIConnectionError

IDs de solicitação

Para recuperar a ID da sua solicitação, você pode usar a propriedade _request_id que corresponde ao cabeçalho de resposta x-request-id.


Novas tentativas

Os seguintes erros são desativados automaticamente duas vezes por padrão com uma breve retirada exponencial:

  • Erros de conexão
  • 408 Tempo Limite da Solicitação
  • 429 Limite de Taxa
  • >=Erros internos 500

Use max_retries para definir/desabilitar o comportamento de repetição:

# For all requests

from openai import AzureOpenAI
client = AzureOpenAI(
# max retires for specific requests

            "role": "user",
            "content": "When was Microsoft founded?",

