プロンプト変換とは
プロンプト変換は、DALL-E 3 画像生成のプロセスで、画像生成のためにモデルに送信される前に、大規模言語モデル (LLM) 呼び出しを使用して元のプロンプトに安全性と品質システム メッセージを適用します。 このシステム メッセージは、意図を維持しながら、より多様で高品質な画像を生成することを目的として、元のプロンプトを豊かにします。
プロンプト変換が元のプロンプトに適用された後、コンテンツ フィルタリングが画像生成の前の第 2 段階として適用されます。詳細については、「コンテンツ フィルタリング」を参照してください。
ヒント
画像生成プロンプトの詳細については、OpenAI の DALL-E ドキュメントを参照してください。
プロンプト変換の例
テキスト プロンプトの例 | プロンプト変換なしで生成された画像の例 | プロンプト変換を使って生成された画像の例 |
---|---|---|
"シアトルのスカイラインの水彩画" |
プロンプト変換が必要な理由
責任があり質の高い世代には、プロンプト変革が不可欠です。 プロンプト変換は、生成された画像の安全性を向上させるだけでなく、プロンプトをより説明的に豊かにし、より高品質で説明的な画像に導きます。
Azure OpenAI DALL-E 3 の既定のプロンプト変換には、Copyright Studio のキャラクターやアートワーク、有名人に加えて、性的、憎悪、不公平、暴力、自傷行為などの有害なコンテンツの画像を生成しないようにモデルを誘導する安全性の強化が含まれています。
プロンプト変換の使用方法
プロンプト変換は、既定ではすべての Azure OpenAI DALL-E 3 要求に適用されます。 プロンプト変換の機能強化の恩恵を受けるための追加設定は必要ありません。
画像生成と同様に、プロンプト変換は大規模言語モデルの性質上、非決定論的です。 元の 1 つのプロンプトが多くの画像バリアントにつながる可能性があります。
プロンプト変換の表示
修正または変換されたプロンプトは、API 応答オブジェクトの revised_prompt
フィールドに表示されます。
Input Content:
{
"prompt": "Watercolor painting of the Seattle skyline",
"n": 1,
"size": "1024x1024"
}
Output Content:
{
"created": 1720557218,
"data": [
{
"content_filter_results": {
...
},
"prompt_filter_results": {
...
},
"revised_prompt": "A soft and vivid watercolor painting capturing the scenic beauty of the Seattle skyline. The painting illustrates a setting sun casting warm hues over the sprawling cityscape, with the Space Needle prominently standing tall against the sky. Imagine the scattered high-rise buildings, a soothing blend of the lush green of the parks with the winding blue water of the Puget Sound, and the snow-covered peak of Mount Rainier in the distance. A play of light and shadow adds depth and dynamism to this multihued urban panorama."
}
}