Azure OpenAI REST API を使用して DALL-E モデルを利用する

3 分

Azure OpenAI Service REST API を使用して、アプリケーションから DALL-E モデルを利用できます。

サービスに REST 呼び出しを行うには、Azure でプロビジョニングした Azure OpenAI Service リソースのエンドポイントと認可キーが必要です。画像生成プロセスを開始するには、ヘッダーに認可キーを使用して POST 要求をサービスエンドポイントに送信します。要求には、JSON 本文に次のパラメーターが含まれている必要があります。

prompt: 生成する画像の説明。
n: 生成する画像の数。 DALL-E 3 は n=1 のみをサポートします。
size: 生成される画像の解像度 (1024x1024、1792x1024、または 1024x1792).
quality "省略可能": 画像の品質 (standard または hd). 既定値は standard です。
style "省略可能": 画像の見た目のスタイル (natural または vivid). 既定値は vivid です。

たとえば、次の JSON を使用して、タキシードを着たアナグマの 512 x 512 画像を生成できます。

{
    "prompt": "A badger wearing a tuxedo",
    "n": 1,
    "size": "512x512",
    "quality": "hd", 
    "style": "vivid"
}

DALL-E 2 などの以前の生成モデルをお使いの場合、最初の要求では画像生成プロセスの結果がすぐには返されません。代わりに、画像生成の結果の準備ができるまでアプリケーションコードがポーリングできるコールバックサービスの URL を含む operation-location ヘッダーが応答に含まれています。

DALL-E 3 では、要求の結果は、生成された画像の URL を含む応答と同期して処理されます。応答は次の JSON のようになります。

{
    "created": 1686780744,
    "data": [
        {
            "url": "<URL of generated image>",
            "revised_prompt": "<prompt that was used>"
        }
    ]
}

data 要素に含まれる url の値は、プロンプトから生成された PNG 画像ファイルを示しており、それを表示またはダウンロードできます。応答には、画像の生成に使われた修正後のプロンプトも含まれています。これは、最も望ましい結果を得るためにシステムによって更新されました。この例の画像は、次の画像のようになります。

タキシードを着たアナグマの画像。

Azure OpenAI REST API を使用して DALL-E モデルを利用する

フィードバック