O que é transformação imediata?
A transformação imediata é um processo na geração de imagens DALL-E 3 que aplica uma mensagem do sistema de segurança e qualidade ao seu prompt original usando uma chamada de modelo de linguagem grande (LLM) antes de ser enviada ao modelo para geração de imagem. Esta mensagem do sistema enriquece o seu prompt original com o objetivo de gerar imagens mais diversificadas e de maior qualidade, mantendo a intenção.
Depois que a transformação do prompt é aplicada ao prompt original, a filtragem de conteúdo é aplicada como uma etapa secundária antes da geração da imagem; para obter mais informações, consulte Filtragem de conteúdo.
Gorjeta
Saiba mais sobre a solicitação de geração de imagens no DALL da OpenAI· E documentação.
Exemplo de transformação rápida
Exemplo de prompt de texto | Exemplo de imagem gerada sem transformação imediata | Exemplo de imagem gerada com transformação rápida |
---|---|---|
"Pintura em aquarela do horizonte de Seattle" |
Por que é necessária uma transformação rápida?
A rápida transformação é essencial para gerações responsáveis e de alta qualidade. A transformação imediata não só melhora a segurança da imagem gerada, mas também enriquece o prompt de uma maneira mais descritiva, levando a imagens descritivas e de maior qualidade.
A transformação de prompt padrão no Azure OpenAI DALL-E 3 contém aprimoramentos de segurança que afastam o modelo da geração de imagens de personagens e obras de arte do Copyright Studio, figuras públicas e outros conteúdos nocivos, como conteúdo sexual, de ódio e injustiça, violência e automutilação.
Como faço para usar a transformação de prompt?
A transformação de prompt é aplicada por padrão a todas as solicitações do Azure OpenAI DALL-E 3. Nenhuma configuração extra é necessária para se beneficiar de aprimoramentos de transformação imediata.
Como a geração de imagens, a transformação imediata é não-determinística devido à natureza dos grandes modelos de linguagem. Um único prompt original pode levar a muitas variantes de imagem.
Exibir transformações de prompt
Seu prompt revisado ou transformado é visível no objeto de resposta da API, conforme mostrado aqui, no revised_prompt
campo.
Input Content:
{
"prompt": "Watercolor painting of the Seattle skyline",
"n": 1,
"size": "1024x1024"
}
Output Content:
{
"created": 1720557218,
"data": [
{
"content_filter_results": {
...
},
"prompt_filter_results": {
...
},
"revised_prompt": "A soft and vivid watercolor painting capturing the scenic beauty of the Seattle skyline. The painting illustrates a setting sun casting warm hues over the sprawling cityscape, with the Space Needle prominently standing tall against the sky. Imagine the scattered high-rise buildings, a soothing blend of the lush green of the parks with the winding blue water of the Puget Sound, and the snow-covered peak of Mount Rainier in the distance. A play of light and shadow adds depth and dynamism to this multihued urban panorama."
}
}