Cómo trabajar con los modelos DALL-E
Los modelos DALL-E de OpenAI generan imágenes basadas en mensajes de texto proporcionados por el usuario. En esta guía se muestra cómo usar los modelos DALL-E y configurar sus opciones a través de llamadas a la API de REST.
Requisitos previos
- Suscripción a Azure. Puede crear una de forma gratuita.
- Un recurso de Azure OpenAI creado en la región Centro de Suecia. Para más información, consulte Creación e implementación de un recurso de Azure OpenAI Service.
- Implemente un modelo de dall-e-3 con el recurso de Azure OpenAI.
Llamada a las API de generación de imágenes
El siguiente comando muestra la forma más básica de usar DALL-E con código. Si es la primera vez que usa estos modelos de forma programada, le recomendamos que empiece con Inicio rápido de DALL-E.
Envíe una solicitud POST a:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Reemplace los siguientes marcadores de posición:
<your_resource_name>
es el nombre del recurso de Azure OpenAI.<your_deployment_name>
es el nombre de la implementación del modelo DALL-E 3.<api_version>
es la versión de la API que desea usar. Por ejemplo,2024-02-01
.
Encabezados obligatorios:
Content-Type
:application/json
api-key
:<your_API_key>
Cuerpo:
A continuación se muestra un cuerpo de solicitud de ejemplo. Especifique una serie de opciones, definidas en secciones posteriores.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Output
La salida de una llamada API de generación de imágenes correcta tiene un aspecto similar al siguiente ejemplo. El campo url
contiene una dirección URL donde puede descargar la imagen generada. La dirección URL permanece activa durante 24 horas.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Rechazo de llamadas API
Las solicitudes e imágenes se filtran en función de nuestra directiva de contenido, devolviendo un error cuando se marca una solicitud o una imagen.
Si la solicitud está marcada elerror.code
valor del mensaje se establece en contentFilter
. Este es un ejemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
También es posible que se filtre la propia imagen generada. En este caso, el mensaje de error se establece en Imagen generada se filtre como resultado de nuestro sistema de seguridad. Este es un ejemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Escribir solicitudes de imágenes
Las indicaciones de imagen deben describir el contenido que desea ver en la imagen y el estilo visual de la imagen.
Cuando escriba solicitudes, tenga en cuenta que las API de generación de imágenes vienen con un filtro de moderación de contenidos. Si el servicio reconoce la solicitud como contenido dañino, no genera una imagen. Para obtener más información, consulte Filtrado de contenido.
Sugerencia
Para obtener una visión exhaustiva de cómo puede ajustar los mensajes de texto para generar diferentes tipos de imágenes, consulte la guía de ingeniería de mensajes de imagen.
Especificar opciones de API
Los siguientes parámetros del cuerpo de la API están disponibles para la generación de imágenes DALL-E.
Size
Especifique el tamaño de las imágenes generadas. Debe ser uno de los modelos ,1024x1024
1792x1024
o 1024x1792
para DALL-E 3. Las imágenes cuadradas son más rápidas de generar.
Estilo
DALL-E 3 presenta dos opciones de estilo: natural
y vivid
. El estilo natural es más similar al estilo predeterminado DALL-E 2, mientras que el estilo vívido genera imágenes más hiper-reales y cinematográficas.
El estilo natural es útil en los casos en los que DALL-E 3 exagera o confunde un tema que está pensado para ser más simple, tenue o realista.
El valor predeterminado es vivid
.
Control de
Hay dos opciones para la calidad de la imagen: hd
y standard
. La opción hd crea imágenes con detalles más finos y mayor coherencia en la imagen. Las imágenes estándar se pueden generar más rápido.
El valor predeterminado es standard
.
Number
Con DALL-E 3, no se puede generar más de una imagen en una sola llamada API: el parámetro n
debe establecerse en 1. Si necesita generar varias imágenes a la vez, realice solicitudes paralelas.
Formato de respuesta
Formato en el que se devuelven las imágenes generadas. Debe ser una de url
(una dirección URL que apunte a la imagen) o b64_json
(el código base de 64 bytes en formato JSON). El valor predeterminado es url
.