¿Qué es la transformación de mensajes?

Artículo
09/03/2024

La transformación de mensajes es un proceso en la generación de imágenes DALL-E 3 que aplica un mensaje de sistema de seguridad y calidad al mensaje original mediante una llamada de modelo de lenguaje grande (LLM) antes de que se envíe al modelo para la generación de imágenes. Este mensaje del sistema enriquece el original con el objetivo de generar imágenes más diversas y de mayor calidad, a la vez que mantiene la intención.

Después de aplicar la transformación de mensajes al mensaje original, el filtrado de contenido se aplica como un paso secundario antes de la generación de imágenes; para más información, vea Filtrado de contenido.

Sugerencia

Más información sobre la generación de imágenes en la documentación de DALL E de OpenAI.

Ejemplo de transformación de mensajes

Ejemplo de solicitud de texto	Ejemplo de imagen generada sin transformación de solicitud	Ejemplo de imagen generada con transformación de solicitud
"Pintura en acuarela del horizonte de Seattle"

¿Por qué es necesaria la transformación de mensajes?

La transformación de mensajes es esencial para las operaciones de generación responsables y de alta calidad. La transformación de mensajes no solo mejora la seguridad de la imagen generada, sino que también enriquece el mensaje de forma más descriptiva, lo que conduce a imágenes de mayor calidad y descriptivas.

La transformación de mensajes predeterminada en DALL-E 3 de Azure OpenAI contiene mejoras de seguridad que alejan el modelo de la generación de imágenes de personajes y obras de arte de Copyright Studio, figuras públicas y otros contenidos dañinos, como contenido sexual, odio e injusticia, violencia y autolesivo.

¿Cómo se usa la transformación de mensajes?

La transformación de mensajes se aplica de manera predeterminada a todas las solicitudes de DALL-E 3 de Azure OpenAI. No se necesita ninguna configuración adicional para beneficiarse de las mejoras de la transformación de mensajes.

Como sucede con la generación de imágenes, la transformación de mensajes no es determinista debido a la naturaleza de los modelos de lenguaje grandes. Un único mensaje original puede dar lugar a muchas variantes de imagen.

Visualización de transformaciones de mensajes

El mensaje revisado o transformado es visible en el objeto de respuesta de la API, como se muestra aquí, en el campo revised_prompt.

Input Content:
{
    "prompt": "Watercolor painting of the Seattle skyline",
    "n": 1,
    "size": "1024x1024"
}
 
Output Content:
{
  "created": 1720557218,
  "data": [
    {
      "content_filter_results": {
        ...
      },
      "prompt_filter_results": {
        ...
      },
      "revised_prompt": "A soft and vivid watercolor painting capturing the scenic beauty of the Seattle skyline. The painting illustrates a setting sun casting warm hues over the sprawling cityscape, with the Space Needle prominently standing tall against the sky. Imagine the scattered high-rise buildings, a soothing blend of the lush green of the parks with the winding blue water of the Puget Sound, and the snow-covered peak of Mount Rainier in the distance. A play of light and shadow adds depth and dynamism to this multihued urban panorama."
    }
}

Pasos siguientes

Inicio rápido de DALL-E

Compartir a través de