Usar a API REST do Azure OpenAI para consumir modelos DALL-E

Concluído

Você pode usar a API REST do serviço Azure OpenAI para consumir modelos DALL-E de aplicativos.

Para fazer uma chamada REST para o serviço, você precisa do ponto de extremidade e da chave de autorização para o recurso do Serviço OpenAI do Azure que você provisionou no Azure. Você inicia o processo de geração de imagem enviando uma solicitação POST para o ponto de extremidade do serviço com a chave de autorização no cabeçalho. A solicitação deve conter os seguintes parâmetros em um corpo JSON:

  • prompt: A descrição da imagem a ser gerada.
  • n: O número de imagens a serem geradas. DALL-E 3 suporta apenas n = 1.
  • tamanho: A resolução da(s) imagem(ns) a ser gerada (1024x1024, 1792x1024 ou 1024x1792).
  • qualidade Opcional: A qualidade da imagem (padrão ou hd). O padrão é padrão.
  • estilo Opcional: O estilo visual da imagem (natural ou vívida). O padrão é vívido.

Por exemplo, o JSON a seguir pode ser usado para gerar uma imagem 512 x 512 de um texugo usando um smoking:

{
    "prompt": "A badger wearing a tuxedo",
    "n": 1,
    "size": "512x512",
    "quality": "hd", 
    "style": "vivid"
}

Se você estiver usando um modelo de geração mais antigo, como o DALL-E 2, a solicitação inicial não retornará imediatamente os resultados do processo de geração de imagens. Em vez disso, a resposta inclui um cabeçalho de local de operação com uma URL para um serviço de retorno de chamada que o código do aplicativo pode sondar até que os resultados da geração de imagem estejam prontos.

Com o DALL-E 3, o resultado da solicitação é processado de forma síncrona com a resposta que contém a URL da imagem gerada. A resposta é semelhante à seguinte JSON:

{
    "created": 1686780744,
    "data": [
        {
            "url": "<URL of generated image>",
            "revised_prompt": "<prompt that was used>"
        }
    ]
}

O elemento data inclui o valor url, que faz referência a um arquivo de imagem PNG gerado a partir do prompt que você pode visualizar ou baixar. A resposta também contém um prompt revisado que foi usado para gerar a imagem, que foi atualizada pelo sistema para alcançar os resultados mais desejáveis. Neste exemplo, a imagem pode ser semelhante à imagem a seguir:

Uma foto de um texugo usando um smoking.