Nutzen von DALL-E-Modellen mithilfe der REST-API von Azure OpenAI

Abgeschlossen

Sie können mit der REST-API von Azure OpenAI Service DALL-E-Modelle in Anwendungen zu nutzen.

Um einen REST-Aufruf an den Dienst zu richten, benötigen Sie den Endpunkt und Autorisierungsschlüssel für die Azure OpenAI Service-Ressource, die Sie in Azure bereitgestellt haben. Sie leiten den Prozess der Bildgenerierung ein, indem Sie eine POST-Anforderung an den Dienstendpunkt mit dem Autorisierungsschlüssel im Header übermitteln. Die Anforderung muss die folgenden Parameter in einem JSON-Körper enthalten:

  • prompt: Die Beschreibung des zu generierenden Bilds.
  • n: Die Anzahl zu generierender Bilder. DALL-E 3 unterstützt nur n=1.
  • Größe: Die Auflösung der zu generierenden Bilder (1024x1024,1792x1024 oder 1024x1792 ).
  • QualitätOptional: Die Qualität des Bilds (Standard oder HD). Der Standardwert ist Standard.
  • Stil Optional: Der visuelle Stil des Bilds (natural oder vivid). Der Standardwert ist vivid.

Beispielsweise lässt sich mit dem folgenden JSON-Code ein Bild der Größe 512 x 512 eines Dachses im Smoking generieren:

{
    "prompt": "A badger wearing a tuxedo",
    "n": 1,
    "size": "512x512",
    "quality": "hd", 
    "style": "vivid"
}

Wenn Sie ein älteres Generationsmodell wie DALL-E 2 verwenden, gibt die ursprüngliche Anforderung nicht sofort die Ergebnisse des Bildgenerierungsprozesses zurück. Stattdessen enthält die Antwort den Header operation-location mit einer URL für einen Rückrufdienst, den Ihr Anwendungscode abfragen kann, bis die Ergebnisse der Bildgenerierung vorliegen.

Mit DALL-E 3 wird das Ergebnis der Anforderung synchron mit der Antwort verarbeitet, die die URL für das generierte Bild enthält. Die Antwort ähnelt dem folgenden JSON-Code:

{
    "created": 1686780744,
    "data": [
        {
            "url": "<URL of generated image>",
            "revised_prompt": "<prompt that was used>"
        }
    ]
}

Das Datenelement enthält den URL-Wert, der auf eine PNG-Bilddatei verweist, die aus der Eingabeaufforderung generiert wird, die Sie dann anzeigen oder herunterladen können. Die Antwort enthält auch eine überarbeitete Eingabeaufforderung, die zum Generieren des Bilds verwendet wurde, das vom System aktualisiert wurde, um die gewünschten Ergebnisse zu erzielen. In diesem Beispiel könnte das Bild wie die folgende Abbildung aussehen:

Bild eines Dachses im Smoking.