Jak pracovat s modely DALL-E
Modely DALL-E openAI generují obrázky na základě uživatelem zadaných textových výzev. Tato příručka ukazuje, jak používat modely DALL-E a konfigurovat jejich možnosti prostřednictvím volání rozhraní REST API.
Požadavky
- Předplatné Azure. Můžete si ho zdarma vytvořit.
- Prostředek Azure OpenAI vytvořený v oblasti Švédsko – střed . Další informace najdete v tématu Vytvoření a nasazení prostředku služby Azure OpenAI.
- Nasaďte model dall-e-3 s prostředkem Azure OpenAI.
Volání rozhraní API pro generování imagí
Následující příkaz ukazuje nejzásadnější způsob použití DALL-E s kódem. Pokud tyto modely používáte programově poprvé, doporučujeme začít rychlým startem DALL-E.
Odešlete požadavek POST na:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Nahraďte následující zástupné symboly:
<your_resource_name>
je název vašeho prostředku Azure OpenAI.<your_deployment_name>
je název nasazení modelu DALL-E 3.<api_version>
je verze rozhraní API, které chcete použít. Například2024-02-01
.
Povinná záhlaví:
Content-Type
:application/json
api-key
:<your_API_key>
Text:
Následuje ukázkový text požadavku. Zadáte řadu možností definovaných v pozdějších částech.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Výstup
Výstup z úspěšného volání rozhraní API pro generování imagí vypadá jako v následujícím příkladu. Pole url
obsahuje adresu URL, kde si můžete stáhnout vygenerovaný obrázek. Adresa URL zůstane aktivní po dobu 24 hodin.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Odmítnutí volání rozhraní API
Výzvy a obrázky se filtrují na základě našich zásad obsahu a vrací chybu při zobrazení výzvy nebo obrázku s příznakem.
Pokud je výzva označena příznakem, error.code
hodnota ve zprávě je nastavena na contentFilter
hodnotu . Tady je příklad:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Je také možné, že se vygenerovaná image filtruje. V tomto případě je chybová zpráva nastavena na Vygenerovaný obrázek byl filtrován v důsledku našeho bezpečnostního systému. Tady je příklad:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Psaní výzev k obrázku
Výzvy k obrázku by měly popisovat obsah, který chcete vidět na obrázku, a vizuální styl obrázku.
Při psaní výzev vezměte v úvahu, že rozhraní API pro generování obrázků mají filtr kon režim stanu ration. Pokud služba rozpozná vaši výzvu jako škodlivý obsah, nevygeneruje obrázek. Další informace najdete v tématu Filtrování obsahu.
Tip
Důkladný přehled o tom, jak můžete upravit textové výzvy k vygenerování různých druhů obrázků, najdete v průvodci technikou výzvy k zobrazení obrázku.
Určení možností rozhraní API
Následující parametry těla rozhraní API jsou k dispozici pro generování imagí DALL-E.
Velikost
Zadejte velikost vygenerovaných imagí. Musí to být jeden z 1024x1024
modelů , 1792x1024
nebo 1024x1792
pro MODELY DALL-E 3. Čtvercové obrázky se generují rychleji.
Styl
DALL-E 3 zavádí dvě možnosti stylu: natural
a vivid
. Přirozený styl je více podobný výchozímu stylu DALL-E 2, zatímco živý styl generuje více hyper-reálné a kinematografické obrázky.
Přirozený styl je užitečný v případech, kdy DALL-E 3 přehání nebo zaměňuje předmět, který má být jednodušší, subduduovaný nebo realistický.
Výchozí hodnota je vivid
.
Kvalita
Existují dvě možnosti pro kvalitu obrázku: hd
a standard
. Možnost hd vytvoří obrázky s jemnými podrobnostmi a větší konzistencí na obrázku. Standardní image je možné generovat rychleji.
Výchozí hodnota je standard
.
Počet
U DALL-E 3 nemůžete v jednom volání rozhraní API vygenerovat více než jednu image: n
parametr musí být nastavený na hodnotu 1. Pokud potřebujete vygenerovat více imagí najednou, proveďte paralelní žádosti.
Formát odpovědi
Formát, ve kterém se vrátí vygenerované obrázky. Musí to být jedna z url
(adresa URL odkazující na obrázek) nebo b64_json
(základní kód 64 bajtů ve formátu JSON). Výchozí hodnota je url
.