Поделиться через


Как работать с моделями DALL-E

Модели DALL-E OpenAI создают изображения на основе текстовых запросов, предоставленных пользователем. В этом руководстве показано, как использовать модели DALL-E и настраивать их параметры с помощью вызовов REST API.

Необходимые компоненты

Вызов API создания образов

В следующей команде показан самый простой способ использования DALL-E с кодом. Если вы впервые используете эти модели программным способом, рекомендуем начать с краткого руководства по DALL-E.

Отправьте запрос POST в:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Замените следующие заполнители:

  • <your_resource_name> — имя ресурса Azure OpenAI.
  • <your_deployment_name> — это имя развертывания модели DALL-E 3.
  • <api_version> — это версия API, которую вы хотите использовать. Например, 2024-02-01.

Обязательные заголовки:

  • Content-Type: application/json
  • api-key: <your_API_key>

Текст.

Ниже приведен пример текста запроса. Вы указываете ряд параметров, определенных в последующих разделах.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Выходные данные

Выходные данные из успешного вызова API создания изображений выглядят следующим образом. Поле url содержит URL-адрес, в котором можно скачать созданный образ. URL-адрес остается активным в течение 24 часов.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Отклонение вызова API

Запросы и изображения фильтруются на основе нашей политики содержимого, возвращая ошибку при помечении запроса или изображения.

Если ваш запрос помечен, error.code для сообщения задано contentFilterзначение . Приведем пример:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Кроме того, возможно, что созданный образ фильтруется. В этом случае сообщение об ошибке установлено на созданный образ, отфильтрованный в результате нашей системы безопасности. Приведем пример:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Написание запросов на изображение

Запросы на изображение должны описать содержимое, которое вы хотите увидеть на изображении, и визуальный стиль изображения.

При написании запросов следует учитывать, что API создания изображений приходят с фильтром con режим палатки ration. Если служба распознает запрос как вредное содержимое, он не создает образ. Дополнительные сведения см. в разделе "Фильтрация содержимого".

Совет

Подробные сведения о том, как можно настроить текстовые запросы на создание различных типов изображений, см. в руководстве по проектированию запросов изображений.

Указание параметров API

Следующие параметры текста API доступны для создания образа DALL-E.

Размер

Укажите размер созданных изображений. Должен быть одним из моделей 1792x1024DALL-E 3 или 1024x1792 одним из 1024x1024них. Квадратные изображения быстрее создаются.

Стиль

DALL-E 3 содержит два варианта стиля: natural и vivid. Естественный стиль более похож на стиль по умолчанию DALL-E 2, а яркий стиль создает более гипер-реальные и кинематографические изображения.

Естественный стиль полезен в случаях, когда DALL-E 3 чрезмерно преувеличивает или путает тему, которая должна быть более простой, подчиненной или реалистичной.

Значение по умолчанию — vivid.

Качество

Существует два варианта качества изображения: hd и standard. Параметр HD создает изображения с более подробными сведениями и более высокой согласованности на изображении. Стандартные образы можно создавать быстрее.

Значение по умолчанию — standard.

Число

При использовании DALL-E 3 невозможно создать несколько образов в одном вызове API: n параметр должен иметь значение 1. Если вам нужно одновременно создать несколько образов, сделайте параллельные запросы.

Формат ответа

Формат, в котором возвращаются созданные изображения. Должен быть одним из url (URL-адрес, указывающий на изображение) или b64_json (базовый 64-байтовый код в формате JSON). Значение по умолчанию — url.