Заголовки изображений (версия 4.0)
Заголовки изображений в анализе изображений 4.0 доступны с помощью функций субтитров и плотных подписей .
Функция заголовка создает одно предложение для всех содержимого изображения. Плотные субтитры предоставляют более подробную информацию, создавая одно предложение описания до 10 разных областей изображения в дополнение к описанию всего изображения. Плотные подписи также возвращают ограничивающие координаты прямоугольники описанных областей изображения. Обе эти функции используют последние модели ИИ на основе Флоренции.
Заголовок изображения доступен только на английском языке.
Внимание
Заголовок изображения в службе "Анализ изображений 4.0" доступен только в определенных регионах центра обработки данных Azure: см . статью "Доступность регионов". Чтобы получить результаты из функций субтитров и плотных подписей, необходимо использовать ресурс Визуального распознавания Azure, расположенный в одном из этих регионов.
Если вам нужно использовать ресурс визуального распознавания за пределами этих регионов для создания подписей изображений, используйте анализ изображений 3.2 , доступный во всех регионах Распознавания искусственного интеллекта Azure.
Быстро и легко опробуйте возможности добавления подписей к изображениям в браузере с помощью Vision Studio.
Заголовки с гендерной нейтральной позицией
По умолчанию подписи содержат гендерные термины ("человек", "женщина", "мальчик" и "девушка"). Вы можете заменить эти термины на "person" в результатах и получить заголовки, нейтральные полом. Это можно сделать, задав необязательный параметр gender-neutral-caption
true
запроса API в URL-адресе запроса.
Примеры подписей и плотных субтитров
В следующем ответе JSON показано, что API анализа изображений 4.0 возвращается при описании примера изображения на основе его визуальных функций.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
Использование API
Функция заголовков изображений является частью API анализа изображений . Включите Caption
в параметр запроса функций . Затем, когда вы получите полный ответ JSON, анализирует строку для содержимого "captionResult"
раздела.