Поделиться через


Выбор домена для проекта «Пользовательское визуальное распознавание»

В этом руководстве показано, как выбрать домен для проекта в службе Пользовательское визуальное распознавание. Домены используются в качестве отправной точки для проекта.

Войдите в учетную запись на веб-сайте Пользовательское визуальное распознавание, а затем выберите проект. Щелкните значок "Параметры" в правом верхнем углу. На странице "Параметры проекта" можно выбрать домен модели. Вы должны выбрать домен, который ближе всего к вашему сценарию использования. Если вы обращаетесь к Пользовательское визуальное распознавание через клиентскую библиотеку или REST API, необходимо указать идентификатор домена при создании проекта. Список идентификаторов доменов можно получить с помощью запроса Get Domains . Или используйте следующую таблицу.

Домены классификации изображений

Домен ID Характер использования
Общие сведения ee85a74c-405e-4adc-bb47-ffa8ca0c9f31 Рассчитан на самые разные задачи классификации изображений. Если ни один из других конкретных доменов не подходит, или если вы не уверены, какой домен выбрать, выберите один из общих доменов.
General [A1] a8e3c40f-fb4a-466f-832a-5e457ae4a344 Оптимизировано для повышения точности с сопоставимым временем вывода в качестве общего домена. Рекомендуется для больших наборов данных или более сложных пользовательских сценариев. Этому домена требуется дополнительное время обучения.
General [A2] 2e37d7fb-3a54-486a-b4d6-cfc369af0018 Оптимизировано для повышения точности с более быстрым временем вывода, чем общее [A1] и общие домены. Рекомендовано для большинства наборов данных. Для этого домена требуется меньше времени обучения, чем домены "Общие" и "Общие".
Food c151d5b5-dd07-472a-acc8-15d29dea8518 Рассчитан для фотографий блюд, которые будут отображаться в меню ресторана. Если вы хотите классифицировать фотографии отдельных фруктов или овощей, используйте домен Food .
Landmarks ca455789-012d-4b50-9fec-5bb63841c793 Рассчитан на распознавание естественных и искусственных ориентиров. Этот домен работает лучше всего, когда ориентир четко виден на фотографии. Этот домен работает, даже если ориентир немного заслоняют люди.
Розничная торговля b30a91ae-e3c1-4f73-a81e-c270bff27c39 Рассчитан на изображения из каталогов товаров и торговых веб-сайтов. Если требуется высокая точность при распознавании таких объектов, как платья, брюки и рубашки, следует использовать этот домен.
Домены Compact Оптимизированы для ограничений классификации в режиме реального времени на пограничных устройствах.

Примечание.

Общие домены [A1] и Общие [A2] можно использовать для широкого набора сценариев и оптимизированы для точности. Используйте модель General [A2] для повышения скорости вывода и более короткого времени обучения. Для больших наборов данных может потребоваться использовать общие данные [A1] для повышения точности, чем общие [A2], хотя для этого требуется больше времени обучения и вывода. Для общей модели требуется больше времени вывода, чем общие [A1] и Общие [A2].

Домены обнаружения объектов

Домен ID Характер использования
Общие сведения da2e3a8a-40a5-4171-82f4-58522f70fbc1 Рассчитан на самые разные задачи обнаружения объектов. Если ни один из других доменов не подходит, или вы не уверены, какой домен выбрать, выберите общий домен.
General [A1] 9c616dff-2e7d-ea11-af59-1866da359ce6 Оптимизировано для повышения точности с сопоставимым временем вывода в качестве общего домена. Рекомендованы для более точного определения местоположения региона, больших наборов данных или более сложных пользовательских сценариев. Для этого домена требуется больше времени обучения, и результаты не детерминируются: ожидается среднее различие средней точности (mAP) +-1% с теми же данными обучения, предоставляемыми.
Логотип 1d8ffafe-ec40-4fb2-8f90-72b3b6cecea4 Оптимизировано для поиска марочных логотипов в изображениях.
Продукты на полках 3780a898-81c3-4516-81ae-3a139614e1f3 Оптимизировано для обнаружения и классификации продуктов на полках.
Домены Compact Оптимизированы для ограничений обнаружения объектов в режиме реального времени на пограничных устройствах.

Домены Compact

Модели, созданные доменами Compact, можно экспортировать для локального запуска. В API общедоступной предварительной версии службы «Пользовательское визуальное распознавание» 3.4 можно получить список экспортируемых платформ для компактных доменов, вызвав API-интерфейс GetDomains.

Все перечисленные ниже домены поддерживают экспорт в форматах ONNX, TensorFlow, TensorFlowLite, TensorFlow.js, CoreML и VAIDK, за исключением того, что домен обнаружения объектов (compact) не поддерживает VAIDK.

Производительность модели зависит от выбранного домена. В следующей таблице мы сообщаем размер модели и время вывода на ЦП Intel Desktop и GPU NVIDIA [1]. Эти числа не включают предварительную и последующую обработку.

Задача Домен ID Размер модели Время вывода ЦП Время вывода GPU
Классификация General (compact) (Общий (компактный)) 0732100f-1a38-4e49-a514-c9b44c697ab5 6 МБ 10 мс 5 мс
Классификация General (compact) [S1] a1db07ca-a19a-4830-bae8-e004a42dc863 43 МБ 50 мс 5 мс
Обнаружение объектов General (compact) (Общий (компактный)) a27d5ca5-bb19-49d8-a70a-fec086c47f5b 45 МБ 35 мс 5 мс
Обнаружение объектов General (compact) [S1] 7ec2ac80-887b-48a6-8df9-8b1357765430 14 МБ 27 мс 7 мс

Примечание.

Для обнаружения объектов требуется специальная логика после обработки. Дополнительные сведения см. в примере скрипта в экспортируемом zip-пакете. Если необходима модель без логики постобработки, используйте General (compact) [S1].

Внимание

Экспортируемые модели не гарантируют точно такой же результат, как и API прогнозирования в облаке. Небольшая разница в реализации выполняющейся платформы или предварительной обработки может привести к увеличению разницы в выходных данных модели. Дополнительные сведения о логике предварительной обработки см . в кратком руководстве. Создание проекта классификации изображений.

[1] процессор Intel Xeon E5-2690 и NVIDIA Tesla M60

Следуйте краткому руководству, чтобы приступить к созданию и обучению проекта Пользовательского визуального распознавания.