Как работать с моделями DALL-E
Модели DALL-E OpenAI создают изображения на основе текстовых запросов, предоставленных пользователем. В этом руководстве показано, как использовать модели DALL-E и настраивать их параметры с помощью вызовов REST API.
Необходимые компоненты
- Подписка Azure. Вы можете создать бесплатную учетную запись.
- Ресурс Azure OpenAI, созданный в центральном регионе Швеции. Дополнительные сведения см. в статье "Создание и развертывание ресурса Службы OpenAI Azure".
- Разверните модель dall-e-3 с помощью ресурса Azure OpenAI.
Вызов API создания образов
В следующей команде показан самый простой способ использования DALL-E с кодом. Если вы впервые используете эти модели программным способом, рекомендуем начать с краткого руководства по DALL-E.
Отправьте запрос POST в:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Замените следующие заполнители:
<your_resource_name>
— имя ресурса Azure OpenAI.<your_deployment_name>
— это имя развертывания модели DALL-E 3.<api_version>
— это версия API, которую вы хотите использовать. Например,2024-02-01
.
Обязательные заголовки:
Content-Type
:application/json
api-key
:<your_API_key>
Текст.
Ниже приведен пример текста запроса. Вы указываете ряд параметров, определенных в последующих разделах.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Выходные данные
Выходные данные из успешного вызова API создания изображений выглядят следующим образом. Поле url
содержит URL-адрес, в котором можно скачать созданный образ. URL-адрес остается активным в течение 24 часов.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Отклонение вызова API
Запросы и изображения фильтруются на основе нашей политики содержимого, возвращая ошибку при помечении запроса или изображения.
Если ваш запрос помечен, error.code
для сообщения задано contentFilter
значение . Приведем пример:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Кроме того, возможно, что созданный образ фильтруется. В этом случае сообщение об ошибке установлено на созданный образ, отфильтрованный в результате нашей системы безопасности. Приведем пример:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Написание запросов на изображение
Запросы на изображение должны описать содержимое, которое вы хотите увидеть на изображении, и визуальный стиль изображения.
При написании запросов следует учитывать, что API создания изображений приходят с фильтром con режим палатки ration. Если служба распознает запрос как вредное содержимое, он не создает образ. Дополнительные сведения см. в разделе "Фильтрация содержимого".
Совет
Подробные сведения о том, как можно настроить текстовые запросы на создание различных типов изображений, см. в руководстве по проектированию запросов изображений.
Указание параметров API
Следующие параметры текста API доступны для создания образа DALL-E.
Размер
Укажите размер созданных изображений. Должен быть одним из моделей 1792x1024
DALL-E 3 или 1024x1792
одним из 1024x1024
них. Квадратные изображения быстрее создаются.
Стиль
DALL-E 3 содержит два варианта стиля: natural
и vivid
. Естественный стиль более похож на стиль по умолчанию DALL-E 2, а яркий стиль создает более гипер-реальные и кинематографические изображения.
Естественный стиль полезен в случаях, когда DALL-E 3 чрезмерно преувеличивает или путает тему, которая должна быть более простой, подчиненной или реалистичной.
Значение по умолчанию — vivid
.
Качество
Существует два варианта качества изображения: hd
и standard
. Параметр HD создает изображения с более подробными сведениями и более высокой согласованности на изображении. Стандартные образы можно создавать быстрее.
Значение по умолчанию — standard
.
Число
При использовании DALL-E 3 невозможно создать несколько образов в одном вызове API: n
параметр должен иметь значение 1. Если вам нужно одновременно создать несколько образов, сделайте параллельные запросы.
Формат ответа
Формат, в котором возвращаются созданные изображения. Должен быть одним из url
(URL-адрес, указывающий на изображение) или b64_json
(базовый 64-байтовый код в формате JSON). Значение по умолчанию — url
.