Arbeiten mit den DALL-E-Modellen
Die DALL-E-Modelle von OpenAI generieren Bilder basierend auf vom Benutzer bereitgestellten Textaufforderungen. In diesem Handbuch wird veranschaulicht, wie Sie die DALL-E-Modelle verwenden und ihre Optionen über REST-API-Aufrufe konfigurieren.
Voraussetzungen
- Ein Azure-Abonnement. Sie können ein kostenloses Konto erstellen.
- Eine Azure OpenAI-Ressource, die in der Region Schweden, Mitte erstellt wurde. Weitere Informationen finden Sie unter Erstellen und Bereitstellen einer Azure OpenAI Service-Ressource.
- Stellen Sie ein dall-e-3-Modell mit Ihrer Azure OpenAI-Ressource bereit.
Aufrufen der Bildgenerierungs-APIs
Der folgende Befehl zeigt die einfachste Methode zum Verwenden von DALL-E mit Code. Wenn Sie diese Modelle zum ersten Mal programmgesteuert verwenden, empfehlen wir Ihnen, mit Schnellstart: DALL-E zu beginnen.
Senden Sie eine POST-Anforderung an:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Ersetzen Sie die folgenden Platzhalter:
<your_resource_name>
ist der Name Ihrer Azure OpenAI-Ressource.<your_deployment_name>
ist der Name Ihrer DALL-E 3-Modellimplementierung.<api_version>
ist die Version der API, die Sie verwenden möchten. Beispiel:2024-02-01
.
Erforderliche Header:
Content-Type
:application/json
api-key
:<your_API_key>
Text:
Es folgt ein Beispiel für den Anforderungstext. Sie geben eine Reihe von Optionen an, die in späteren Abschnitten definiert sind.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Output
Die Ausgabe eines erfolgreichen Aufrufs der Bilderstellungs-API sieht wie im folgenden Beispiel aus. Das Feld url
enthält eine URL, in der Sie das generierte Image herunterladen können. Die URL bleibt 24 Stunden aktiv.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API-Anrufablehnung
Aufforderungen und Bilder werden basierend auf unserer Inhaltsrichtlinie gefiltert und geben einen Fehler zurück, wenn eine Eingabeaufforderung oder ein Bild gekennzeichnet wird.
Wenn Ihre Eingabeaufforderung gekennzeichnet ist, wird der error.code
Wert in der Nachricht auf contentFilter
gesetzt. Ein Beispiel:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Es ist auch möglich, dass das generierte Image selbst gefiltert wird. In diesem Fall wird die Fehlermeldung auf Das generierte Bild wurde von unserem Sicherheitssystem gefiltert. festgelegt. Ein Beispiel:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Schreiben von Bildaufforderungen
Ihre Bildprompts sollten den Inhalt beschreiben, den Sie im Bild sehen möchten, sowie den visuellen Stil des Bilds.
Berücksichtigen Sie beim Schreiben von Eingabeaufforderungen, dass die APIs der Bildgenerierung mit einem Inhaltsmoderationsfilter enthalten sind. Wenn der Dienst Ihren Prompt als schädlichen Inhalt erkennt, generiert er kein Bild. Weitere Informationen dazu finden Sie unter Inhaltsfilterung.
Tipp
Einen ausführlichen Überblick darüber, wie Sie Ihre Textprompts optimieren können, um verschiedene Arten von Bildern zu generieren, finden Sie im Leitfaden zum Erstellen von Bildprompts.
Angeben von API-Optionen
Die folgenden API-Textkörperparameter sind für die DALL-E-Bildgenerierung verfügbar.
Size
Geben Sie die Größe der generierten Bilder an. Muss 1024x1024
, 1792x1024
oder 1024x1792
für DALL-E 3 -Modelle sein. Quadratische Bilder können schneller generiert werden.
Stil
DALL-E 3 führt zwei Stiloptionen ein: natural
und vivid
. Die Stiloption „natural“ ähnelt dem DALL-E 2-Standardstil, während die Stiloption „vivid“ mehr hyper-reale und kinematografische Bilder generiert.
Der Stil „natural“ ist nützlich in Fällen, in denen DALL-E 3 übertreibt oder ein Thema verwechselt, das einfacher, dezenter oder realistischer sein soll.
Der Standardwert ist vivid
.
Quality
Es gibt zwei Optionen für die Bildqualität: hd
und standard
. Bei Verwendung der HD-Option werden Bilder mit mehr Details und höherer Konsistenz im gesamten Bild erstellt. Standard-Bilder können schneller generiert werden.
Der Standardwert ist standard
.
Anzahl
Mit DALL-E 3 können Sie nicht mehr als ein Bild in einem einzelnen API-Aufruf generieren: Der n
-Parameter muss auf 1 gesetzt sein. Wenn Sie mehrere Bilder gleichzeitig generieren müssen, stellen Sie parallele Anforderungen.
Antwortformat
Das Format, in dem die generierten Bilder zurückgegeben werden. Muss url
(eine URL, die auf das Bild zeigt) oder b64_json
(Base64-Byte-Code im JSON-Format) sein. Der Standardwert ist url
.