Korzystanie z interfejsu API REST usługi Azure OpenAI do korzystania z modeli DALL-E

Ukończone

Interfejs API REST usługi Azure OpenAI umożliwia korzystanie z modeli DALL-E z aplikacji.

Aby wykonać wywołanie REST do usługi, potrzebny jest punkt końcowy i klucz autoryzacji dla zasobu usługi Azure OpenAI Service, który został aprowizowany na platformie Azure. Proces generowania obrazu należy zainicjować, przesyłając żądanie POST do punktu końcowego usługi przy użyciu klucza autoryzacji w nagłówku. Żądanie musi zawierać następujące parametry w treści JSON:

  • prompt: opis obrazu do wygenerowania.
  • n: liczba obrazów do wygenerowania. Język DALL-E 3 obsługuje tylko n=1.
  • rozmiar: rozdzielczość obrazów do wygenerowania (1024x1024, 1792x1024 lub 1024x1792).
  • jakość opcjonalna: jakość obrazu (standardowa lub hd). Wartość domyślna to standard.
  • styl opcjonalny: styl wizualizacji obrazu (naturalny lub żywy). Wartości domyślne do żywych.

Na przykład poniższy kod JSON może służyć do wygenerowania obrazu 512 x 512 borsuka, który nosi tuxedo:

{
    "prompt": "A badger wearing a tuxedo",
    "n": 1,
    "size": "512x512",
    "quality": "hd", 
    "style": "vivid"
}

Jeśli używasz starszego modelu generacji, takiego jak DALL-E 2, początkowe żądanie nie zwraca natychmiast wyników procesu generowania obrazu. Zamiast tego odpowiedź zawiera nagłówek lokalizacji operacji z adresem URL usługi wywołania zwrotnego, którą kod aplikacji może sondować, dopóki wyniki generowania obrazu nie będą gotowe.

W przypadku języka DALL-E 3 wynik żądania jest przetwarzany synchronicznie z odpowiedzią zawierającą adres URL wygenerowanego obrazu. Odpowiedź jest podobna do następującego kodu JSON:

{
    "created": 1686780744,
    "data": [
        {
            "url": "<URL of generated image>",
            "revised_prompt": "<prompt that was used>"
        }
    ]
}

Element danych zawiera wartość adresu URL , która odwołuje się do pliku obrazu PNG wygenerowanego z monitu, który można następnie wyświetlić lub pobrać. Odpowiedź zawiera również poprawiony monit , który został użyty do wygenerowania obrazu, który został zaktualizowany przez system w celu uzyskania najbardziej pożądanych wyników. W tym przykładzie obraz może wyglądać podobnie do poniższego obrazu:

Zdjęcie borsuka ubranego w tuxedo.