Классификация изображения
Помимо тегов и описания, анализ изображений 3.2 может возвращать категории на основе таксономии, обнаруженные на изображении. В отличие от тегов, категории организованы в родительской или дочерней иерархии, и их меньше (86, в отличие от тысяч тегов). Все категории имен указаны на английском языке. Классификация может выполняться самостоятельно или в том же вызове API, что и новая модель тегов.
Таксономия 86 категорий
Azure AI Vision может классифицировать изображение широко или конкретно, используя список из 86 категорий на следующей схеме. Полную таксономию в формате текста см. в статье 86-Categories Taxonomy (Таксономия 86 категорий).
Примеры классификации изображений
Следующий ответ JSON иллюстрирует, что Azure AI Vision возвращает при классификации примера изображения на основе его визуальных функций.
{
"categories": [
{
"name": "people_",
"score": 0.81640625
}
],
"requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
"metadata": {
"height": 200,
"width": 300,
"format": "Jpeg"
}
}
В следующей таблице показан типичный набор изображений и категория, возвращаемая Azure AI Vision для каждого изображения.
Изображения | Категория |
---|---|
![]() |
people_group |
![]() |
animal_dog |
![]() |
outdoor_mountain |
![]() |
food_bread |
Использование API
Функция классификации является частью API анализа образа 3.2 . Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Categories
в параметр запроса visualFeatures. Затем, получив полный ответ JSON, просто выполните анализ строки для поиска содержимого раздела "categories"
.
Связанный контент
Изучите понятия, связанные с маркировкой и описанием изображений.