Saiba como usar a saída reproduzível (versão prévia)
Por padrão, se você fizer a mesma pergunta várias vezes a um modelo de Conclusão de Chat do OpenAI do Azure, é provável que você obtenha uma resposta diferente. As respostas são, portanto, consideradas não determinísticas. A saída reproduzível é uma nova versão prévia do recurso que permite alterar seletivamente o comportamento padrão para ajudar a produzir saídas mais determinísticas.
Suporte a saída reproduzível
Atualmente, a saída reproduzível só tem suporte com o seguinte:
Modelos com suporte
gpt-35-turbo
(1106)gpt-35-turbo
(0125)gpt-4
(1106-preview)gpt-4
(0125-Preview)gpt-4
(turbo-2024-04-09)gpt-4o-mini
(18/07/2024)gpt-4o
(2024-05-13)
Consulte a página de modelos para obter as informações mais recentes sobre a disponibilidade regional do modelo.
Versão da API
O suporte para saída reproduzível foi adicionado pela primeira vez na versão da API 2023-12-01-preview
Exemplo
Primeiro, geraremos três respostas para a mesma pergunta a fim de demonstrar a variabilidade que é comum às respostas de Conclusão de Chat, mesmo quando outros parâmetros são os mesmos:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01"
)
for i in range(3):
print(f'Story Version {i + 1}\n---')
response = client.chat.completions.create(
model="gpt-35-turbo-0125", # Model = should match the deployment name you chose for your 0125-preview model deployment
#seed=42,
temperature=0.7,
max_tokens =50,
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Tell me a story about how the universe began?"}
]
)
print(response.choices[0].message.content)
print("---\n")
del response
Saída
Story Version 1
---
Once upon a time, before there was time, there was nothing but a vast emptiness. In this emptiness, there existed a tiny, infinitely dense point of energy. This point contained all the potential for the universe as we know it. And
---
Story Version 2
---
Once upon a time, long before the existence of time itself, there was nothing but darkness and silence. The universe lay dormant, a vast expanse of emptiness waiting to be awakened. And then, in a moment that defies comprehension, there
---
Story Version 3
---
Once upon a time, before time even existed, there was nothing but darkness and stillness. In this vast emptiness, there was a tiny speck of unimaginable energy and potential. This speck held within it all the elements that would come
Observe que, embora cada história possa ter elementos semelhantes e algumas repetições verbatim, quanto mais tempo as respostas continuarem, mais elas tendem a divergir.
Agora vamos executar o mesmo código de antes, mas, desta vez, removeremos marca de comentário da linha para o parâmetro que diz seed=42
import os
from openai import AzureOpenAI
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01"
)
for i in range(3):
print(f'Story Version {i + 1}\n---')
response = client.chat.completions.create(
model="gpt-35-turbo-0125", # Model = should match the deployment name you chose for your 0125-preview model deployment
seed=42,
temperature=0.7,
max_tokens =50,
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Tell me a story about how the universe began?"}
]
)
print(response.choices[0].message.content)
print("---\n")
del response
Saída
Story Version 1
---
In the beginning, there was nothing but darkness and silence. Then, suddenly, a tiny point of light appeared. This point of light contained all the energy and matter that would eventually form the entire universe. With a massive explosion known as the Big Bang
---
Story Version 2
---
In the beginning, there was nothing but darkness and silence. Then, suddenly, a tiny point of light appeared. This point of light contained all the energy and matter that would eventually form the entire universe. With a massive explosion known as the Big Bang
---
Story Version 3
---
In the beginning, there was nothing but darkness and silence. Then, suddenly, a tiny point of light appeared. This was the moment when the universe was born.
The point of light began to expand rapidly, creating space and time as it grew.
---
Usando o mesmo parâmetro seed
de 42 para cada uma de nossas três solicitações, mantendo todos os outros parâmetros iguais, podemos produzir resultados muito mais consistentes.
Importante
O determinismo não é garantido com saída reproduzível. Mesmo nos casos em que o parâmetro seed e system_fingerprint
são iguais em chamadas à API, atualmente não é incomum observar um grau de variabilidade nas respostas. Chamadas à API idênticas com valores max_tokens
maiores geralmente resultarão em respostas menos determinísticas mesmo quando o parâmetro seed for definido.
Detalhes do parâmetro
seed
é um parâmetro opcional que pode ser definido como um inteiro ou nulo.
Esse recurso está em Preview. Se especificado, nosso sistema fará o melhor esforço para amostrar deterministicamente, de modo que solicitações repetidas com a mesma semente e parâmetros devem retornar o mesmo resultado. O determinismo não é garantido e você deve consultar o parâmetro de resposta system_fingerprint
para monitorar as alterações no back-end.
system_fingerprint
é uma cadeia de caracteres e faz parte do objeto de conclusão de chat.
Essa impressão digital representa a configuração de back-end com a qual o modelo é executado.
Ela pode ser usada com o parâmetro de solicitação de semente para entender quando foram feitas alterações de back-end que podem afetar o determinismo.
Para exibir o objeto de conclusão de chat completo, system_fingerprint
você pode adicionar print(response.model_dump_json(indent=2))
ao código Python anterior ao lado da instrução de impressão existente ou $response | convertto-json -depth 5
no final do exemplo do PowerShell. Essa alteração resulta nas seguintes informações adicionais que fazem parte da saída:
Saída
{
"id": "chatcmpl-8LmLRatZxp8wsx07KGLKQF0b8Zez3",
"choices": [
{
"finish_reason": "length",
"index": 0,
"message": {
"content": "In the beginning, there was nothing but a vast emptiness, a void without form or substance. Then, from this nothingness, a singular event occurred that would change the course of existence forever—The Big Bang.\n\nAround 13.8 billion years ago, an infinitely hot and dense point, no larger than a single atom, began to expand at an inconceivable speed. This was the birth of our universe, a moment where time and space came into being. As this primordial fireball grew, it cooled, and the fundamental forces that govern the cosmos—gravity, electromagnetism, and the strong and weak nuclear forces—began to take shape.\n\nMatter coalesced into the simplest elements, hydrogen and helium, which later formed vast clouds in the expanding universe. These clouds, driven by the force of gravity, began to collapse in on themselves, creating the first stars. The stars were crucibles of nuclear fusion, forging heavier elements like carbon, nitrogen, and oxygen",
"role": "assistant",
"function_call": null,
"tool_calls": null
},
"content_filter_results": {
"hate": {
"filtered": false,
"severity": "safe"
},
"self_harm": {
"filtered": false,
"severity": "safe"
},
"sexual": {
"filtered": false,
"severity": "safe"
},
"violence": {
"filtered": false,
"severity": "safe"
}
}
}
],
"created": 1700201417,
"model": "gpt-4",
"object": "chat.completion",
"system_fingerprint": "fp_50a4261de5",
"usage": {
"completion_tokens": 200,
"prompt_tokens": 27,
"total_tokens": 227
},
"prompt_filter_results": [
{
"prompt_index": 0,
"content_filter_results": {
"hate": {
"filtered": false,
"severity": "safe"
},
"self_harm": {
"filtered": false,
"severity": "safe"
},
"sexual": {
"filtered": false,
"severity": "safe"
},
"violence": {
"filtered": false,
"severity": "safe"
}
}
}
]
}
Considerações adicionais
Quando você desejar usar saídas reproduzíveis, será necessário definir o seed
como o mesmo inteiro entre as chamadas de conclusão de chat. Você também deve corresponder a quaisquer outros parâmetros, como temperature
, max_tokens
etc.