Поделиться через


Какую модель следует выбрать?

Azure AI Document Intelligence поддерживает широкий спектр моделей, позволяющих добавлять интеллектуальную обработку документов в приложения и оптимизировать рабочие процессы. Выбор правильной модели необходим для обеспечения успеха вашей организации. В этой статье мы рассмотрим доступные модели аналитики документов и укажите рекомендации по выбору оптимального решения для ваших проектов.

На следующих диаграммах принятия решений выделены функции каждой поддерживаемой модели, которые помогут выбрать модель, которая лучше всего соответствует потребностям и требованиям приложения.

Внимание

Обязательно проверьте страницу поддержки языка для поддерживаемого текста языка и извлечения полей по компоненту.

Предварительно обученные модели анализа документов

Document type Пример Извлекаемые данные Лучшее решение
Универсальный документ. Контракт или письмо. Вы хотите в первую очередь извлечь письменные или печатные текстовые строки, слова, расположения и обнаруженные языки. Чтение модели OCR
Документ, содержащий структурную информацию. Отчет или исследование. Помимо написанного или печатного текста, необходимо извлечь структурную информацию, например таблицы, знаки выделения, абзацы, заголовки, заголовки и подзаголовок. Модель анализа макета
Структурированный или полуструктурированный документ, содержащий содержимое, отформатированное как поля (ключи) и значения. Форма или документ, который является стандартным форматом, часто используемым в вашей компании или отрасли, например кредитным приложением или опросом. Вам нужно извлечь поля и значения, включая те, которые не охватываются предварительно созданными моделями для конкретного сценария без необходимости обучения настраиваемой модели. **Модель анализа макета с включенным необязательным параметром features=keyValuePairs строки запроса **

Предварительно обученные модели для конкретных сценариев

Document type Извлекаемые данные Лучшее решение
Единый налог США Вы хотите извлечь ключевые сведения во всех налоговых формах W2, 1040, 1090, 1098 из одного файла без использования пользовательской классификации. Единая налоговая модель США
Налог США W-2 Вы хотите извлечь ключевые сведения, такие как зарплата, заработная плата и налоги, удержанные. Модель налогового налога США W-2
Налог США W-4 Вы хотите извлечь ключевые сведения, такие как корректировки утверждений, персональные данные. Модель налога США W-4
Налог США 1095(A,C) Вы хотите извлечь налоговый кредит на премиум, заранее кредитную оплату. Модель налога США 1095
Налог США 1098 Вы хотите извлечь сведения об ипотеке, такие как основные, точки и налог. Модель налога США 1098
Налог США 1098-E Вы хотите извлечь сведения о проценте для учащихся, таких как кредитор и процентная сумма. Модель налога США 1098-E
Налог США 1098T Вы хотите извлечь квалифицированные сведения об обучении, такие как корректировка стипендии, статус студента и информация кредитора. Модель налога США 1098-T
Налог США 1099(варианты) Вы хотите извлечь информацию из 1099 форм и ее вариантов (A, B, C, CAP, DIV, G, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Модель налога США 1099
Налог США 1040(варианты) Вы хотите извлечь сведения из 1040 форм и его вариантов (расписание 1, расписание 2, расписание 3, расписание 8812, расписание A, Расписание B, Расписание C, Расписание D, Расписание E EIC, Расписание F, Расписание F, Расписание J, Расписание J, Расписание R, SEРасписание, Расписание. Модель налога США 1040
Банковский оператор Вы хотите извлечь ключевую информацию из банковского оператора США \Банковский оператор
Банковский контроль Вы хотите извлечь ключевые сведения из проверяемого документа. Банковский контроль
Контракт (юридическое соглашение между сторонами). Вы хотите извлечь сведения о соглашении о контракте, такие как стороны, даты и интервалы. Модель контракта
Карточка медицинского страхования или идентификатор медицинского страхования. Вы хотите извлечь ключевые сведения, такие как страховщик, идентификатор члена, покрытие рецептов и номер группы. Модель карты медицинского страхования
Кредитная/дебетовая карта Вы хотите извлечь банковские карты с ключами, такие как номер карты и имя банка. Модель кредитной и дебетовой карты
Свидетельство о браке Вы хотите извлечь ключевые сведения из сертификатов о браке. Модель сертификата о браке
Инструкция "Счет" или "Выставление счетов" Вы хотите извлечь ключевые сведения, такие как имя клиента, адрес выставления счетов и сумма. Модель накладных
Получение, ваучер или одностраничные квитанции об отеле. Вы хотите извлечь ключевые сведения, такие как имя продавца, дата транзакции и общая сумма транзакций. Модель получения
Документ удостоверений (идентификатор), например водительская лицензия США или международный паспорт Вы хотите извлечь ключевые сведения, такие как имя, фамилия, дата рождения, адрес и подпись. Модель документа удостоверений (ID)
Оплата заглушки Вы хотите извлечь ключевые сведения из документа с заглушки оплаты. Модель заглушки оплаты
Ипотека США 1003 Вы хотите извлечь ключевые сведения из приложения универсального жилищного кредита. Модель формы 1003
Ипотека США 1004 Вы хотите извлечь ключевые сведения из универсального отчета об оценке жилых домов (URAR). Модель формы 1004
Ипотека США 1005 Вы хотите извлечь ключевые сведения из формы проверки занятости Модель формы 1005
Ипотека США 1008 Вы хотите извлечь ключевые сведения из сводки по универсальному андеррайтингу и передаче. Модель формы 1008
Раскрытие ипотечных кредитов США Вы хотите извлечь ключевые сведения из формы раскрытия ипотеки. Модель формы раскрытия ипотеки
Документы смешанного типа со структурированными, полуструктурированными и (или) неструктурированными элементами Вам нужно извлечь пары "ключ-значение", метки выбора, таблицы, поля подписи и выбранные регионы, не извлеченные предварительно созданной моделью или моделью документов общего назначения. Пользовательская модель

Совет

  • Если вы по-прежнему не уверены, какая предварительно обученная модель используется, попробуйте использовать модель макета с включенным необязательным параметром features=keyValuePairs строки запроса.
  • Модель макета используется подсистемой чтения OCR для обнаружения страниц, таблиц, стилей, текста, строк, слов, расположений и языков.

Пользовательские модели извлечения

Обучающий набор Примеры документов Лучшее решение
Структурированные, согласованные документы со статическим макетом. Структурированные формы, такие как анкеты или приложения. Пользовательская модель шаблона
Структурированные и полуструктурированные. • Структурированные → опросы
● Полуструктурированные → счета
Пользовательская нейронная модель
Коллекция нескольких моделей, каждая из которых обучена на документах аналогичного типа. • Поставки заказов
на покупку оборудования ● Заказы на покупку оборудования ● Заказы на покупку
мебели Все, состоящие в одной модели.
Составная настраиваемая модель

Пользовательская модель классификации

Обучающий набор Примеры документов Лучшее решение
По крайней мере два разных типа документов. Формы, письма или документы Пользовательская модель классификации

Следующие шаги