Udostępnij za pośrednictwem


Co to jest transformacja monitu?

Transformacja monitu to proces generowania obrazów DALL-E 3, który stosuje do oryginalnego monitu komunikat o bezpieczeństwie i jakości przy użyciu wywołania dużego modelu językowego (LLM) przed wysłaniem do modelu na potrzeby generowania obrazów. Ten komunikat systemowy wzbogaca oryginalny monit o cel generowania bardziej zróżnicowanych i wyższej jakości obrazów przy zachowaniu intencji.

Po zastosowaniu przekształcenia monitu do oryginalnego monitu filtrowanie zawartości jest stosowane jako dodatkowy krok przed wygenerowaniem obrazu; Aby uzyskać więcej informacji, zobacz Filtrowanie zawartości.

Napiwek

Dowiedz się więcej o generowaniu obrazów monitujących w języku DALL platformy OpenAI· Dokumentacja E.

Przykład transformacji monitu

Przykładowy monit tekstowy Przykład wygenerowany obraz bez przekształcenia monitu Przykład wygenerowany obraz z transformacją monitu
"Malowanie akwareli z panoramy Seattle" Malowanie akwareli z panoramy Seattle (proste). Malowanie akwareli z panoramy Seattle, z bardziej szczegółowym i strukturą.

Dlaczego potrzebna jest transformacja monitu?

Transformacja monitu jest niezbędna dla odpowiedzialnych i wysokiej jakości pokoleń. Transformacja monitu nie tylko zwiększa bezpieczeństwo wygenerowanego obrazu, ale także wzbogaca monit w bardziej opisowy sposób, co prowadzi do wyższej jakości i opisowych obrazów.

Domyślna transformacja monitu w usłudze Azure OpenAI DALL-E 3 zawiera ulepszenia bezpieczeństwa, które uniemożliwiają generowanie obrazów postaci i dzieł sztuki programu Copyright Studio, osób publicznych i innych szkodliwych treści, takich jak seksualna, nienawiść i niesprawiedliwość, przemoc i zawartość samookaleczenia.

Jak mogę użyć przekształcenia monitu?

Transformacja monitu jest domyślnie stosowana do wszystkich żądań daLL-E 3 usługi Azure OpenAI. Nie jest wymagana dodatkowa konfiguracja w celu skorzystania z ulepszeń transformacji monitu.

Podobnie jak generowanie obrazów, transformacja monitu nie jest deterministyczna ze względu na charakter dużych modeli językowych. Pojedynczy oryginalny monit może prowadzić do wielu wariantów obrazu.

Wyświetlanie przekształceń monitów

Poprawiony lub przekształcony monit jest widoczny w obiekcie odpowiedzi interfejsu API, jak pokazano tutaj, w revised_prompt polu.

Input Content:
{
    "prompt": "Watercolor painting of the Seattle skyline",
    "n": 1,
    "size": "1024x1024"
}
 
Output Content:
{
  "created": 1720557218,
  "data": [
    {
      "content_filter_results": {
        ...
      },
      "prompt_filter_results": {
        ...
      },
      "revised_prompt": "A soft and vivid watercolor painting capturing the scenic beauty of the Seattle skyline. The painting illustrates a setting sun casting warm hues over the sprawling cityscape, with the Space Needle prominently standing tall against the sky. Imagine the scattered high-rise buildings, a soothing blend of the lush green of the parks with the winding blue water of the Puget Sound, and the snow-covered peak of Mount Rainier in the distance. A play of light and shadow adds depth and dynamism to this multihued urban panorama."
    }
}

Następne kroki