Freigeben über


Arbeiten mit den DALL-E-Modellen

Die DALL-E-Modelle von OpenAI generieren Bilder basierend auf vom Benutzer bereitgestellten Textaufforderungen. In diesem Handbuch wird veranschaulicht, wie Sie die DALL-E-Modelle verwenden und ihre Optionen über REST-API-Aufrufe konfigurieren.

Voraussetzungen

Aufrufen der Bildgenerierungs-APIs

Der folgende Befehl zeigt die einfachste Methode zum Verwenden von DALL-E mit Code. Wenn Sie diese Modelle zum ersten Mal programmgesteuert verwenden, empfehlen wir Ihnen, mit Schnellstart: DALL-E zu beginnen.

Senden Sie eine POST-Anforderung an:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Ersetzen Sie die folgenden Platzhalter:

  • <your_resource_name> ist der Name Ihrer Azure OpenAI-Ressource.
  • <your_deployment_name> ist der Name Ihrer DALL-E 3-Modellimplementierung.
  • <api_version> ist die Version der API, die Sie verwenden möchten. Beispiel: 2024-02-01.

Erforderliche Header:

  • Content-Type: application/json
  • api-key: <your_API_key>

Text:

Es folgt ein Beispiel für den Anforderungstext. Sie geben eine Reihe von Optionen an, die in späteren Abschnitten definiert sind.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Output

Die Ausgabe eines erfolgreichen Aufrufs der Bilderstellungs-API sieht wie im folgenden Beispiel aus. Das Feld url enthält eine URL, in der Sie das generierte Image herunterladen können. Die URL bleibt 24 Stunden aktiv.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

API-Anrufablehnung

Aufforderungen und Bilder werden basierend auf unserer Inhaltsrichtlinie gefiltert und geben einen Fehler zurück, wenn eine Eingabeaufforderung oder ein Bild gekennzeichnet wird.

Wenn Ihre Eingabeaufforderung gekennzeichnet ist, wird der error.code Wert in der Nachricht auf contentFilter gesetzt. Ein Beispiel:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Es ist auch möglich, dass das generierte Image selbst gefiltert wird. In diesem Fall wird die Fehlermeldung auf Das generierte Bild wurde von unserem Sicherheitssystem gefiltert. festgelegt. Ein Beispiel:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Schreiben von Bildaufforderungen

Ihre Bildprompts sollten den Inhalt beschreiben, den Sie im Bild sehen möchten, sowie den visuellen Stil des Bilds.

Berücksichtigen Sie beim Schreiben von Eingabeaufforderungen, dass die APIs der Bildgenerierung mit einem Inhaltsmoderationsfilter enthalten sind. Wenn der Dienst Ihren Prompt als schädlichen Inhalt erkennt, generiert er kein Bild. Weitere Informationen dazu finden Sie unter Inhaltsfilterung.

Tipp

Einen ausführlichen Überblick darüber, wie Sie Ihre Textprompts optimieren können, um verschiedene Arten von Bildern zu generieren, finden Sie im Leitfaden zum Erstellen von Bildprompts.

Angeben von API-Optionen

Die folgenden API-Textkörperparameter sind für die DALL-E-Bildgenerierung verfügbar.

Size

Geben Sie die Größe der generierten Bilder an. Muss 1024x1024, 1792x1024 oder 1024x1792 für DALL-E 3 -Modelle sein. Quadratische Bilder können schneller generiert werden.

Stil

DALL-E 3 führt zwei Stiloptionen ein: natural und vivid. Die Stiloption „natural“ ähnelt dem DALL-E 2-Standardstil, während die Stiloption „vivid“ mehr hyper-reale und kinematografische Bilder generiert.

Der Stil „natural“ ist nützlich in Fällen, in denen DALL-E 3 übertreibt oder ein Thema verwechselt, das einfacher, dezenter oder realistischer sein soll.

Der Standardwert ist vivid.

Quality

Es gibt zwei Optionen für die Bildqualität: hd und standard. Bei Verwendung der HD-Option werden Bilder mit mehr Details und höherer Konsistenz im gesamten Bild erstellt. Standard-Bilder können schneller generiert werden.

Der Standardwert ist standard.

Anzahl

Mit DALL-E 3 können Sie nicht mehr als ein Bild in einem einzelnen API-Aufruf generieren: Der n-Parameter muss auf 1 gesetzt sein. Wenn Sie mehrere Bilder gleichzeitig generieren müssen, stellen Sie parallele Anforderungen.

Antwortformat

Das Format, in dem die generierten Bilder zurückgegeben werden. Muss url (eine URL, die auf das Bild zeigt) oder b64_json (Base64-Byte-Code im JSON-Format) sein. Der Standardwert ist url.