Какую модель следует выбрать?
Azure AI Document Intelligence поддерживает широкий спектр моделей, позволяющих добавлять интеллектуальную обработку документов в приложения и оптимизировать рабочие процессы. Выбор правильной модели необходим для обеспечения успеха вашей организации. В этой статье мы рассмотрим доступные модели аналитики документов и укажите рекомендации по выбору оптимального решения для ваших проектов.
На следующих диаграммах принятия решений выделены функции каждой поддерживаемой модели, которые помогут выбрать модель, которая лучше всего соответствует потребностям и требованиям приложения.
Внимание
Обязательно проверьте страницу поддержки языка для поддерживаемого текста языка и извлечения полей по компоненту.
Предварительно обученные модели анализа документов
Document type | Пример | Извлекаемые данные | Лучшее решение |
---|---|---|---|
Универсальный документ. | Контракт или письмо. | Вы хотите в первую очередь извлечь письменные или печатные текстовые строки, слова, расположения и обнаруженные языки. | Чтение модели OCR |
Документ, содержащий структурную информацию. | Отчет или исследование. | Помимо написанного или печатного текста, необходимо извлечь структурную информацию, например таблицы, знаки выделения, абзацы, заголовки, заголовки и подзаголовок. | Модель анализа макета |
Структурированный или полуструктурированный документ, содержащий содержимое, отформатированное как поля (ключи) и значения. | Форма или документ, который является стандартным форматом, часто используемым в вашей компании или отрасли, например кредитным приложением или опросом. | Вам нужно извлечь поля и значения, включая те, которые не охватываются предварительно созданными моделями для конкретного сценария без необходимости обучения настраиваемой модели. |
**Модель анализа макета с включенным необязательным параметром features=keyValuePairs строки запроса ** |
Предварительно обученные модели для конкретных сценариев
Document type | Извлекаемые данные | Лучшее решение |
---|---|---|
Единый налог США | Вы хотите извлечь ключевые сведения во всех налоговых формах W2, 1040, 1090, 1098 из одного файла без использования пользовательской классификации. | Единая налоговая модель США |
Налог США W-2 | Вы хотите извлечь ключевые сведения, такие как зарплата, заработная плата и налоги, удержанные. | Модель налогового налога США W-2 |
Налог США W-4 | Вы хотите извлечь ключевые сведения, такие как корректировки утверждений, персональные данные. | Модель налога США W-4 |
Налог США 1095(A,C) | Вы хотите извлечь налоговый кредит на премиум, заранее кредитную оплату. | Модель налога США 1095 |
Налог США 1098 | Вы хотите извлечь сведения об ипотеке, такие как основные, точки и налог. | Модель налога США 1098 |
Налог США 1098-E | Вы хотите извлечь сведения о проценте для учащихся, таких как кредитор и процентная сумма. | Модель налога США 1098-E |
Налог США 1098T | Вы хотите извлечь квалифицированные сведения об обучении, такие как корректировка стипендии, статус студента и информация кредитора. | Модель налога США 1098-T |
Налог США 1099(варианты) | Вы хотите извлечь информацию из 1099 форм и ее вариантов (A, B, C, CAP, DIV, G, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Модель налога США 1099 |
Налог США 1040(варианты) | Вы хотите извлечь сведения из 1040 форм и его вариантов (расписание 1, расписание 2, расписание 3, расписание 8812, расписание A, Расписание B, Расписание C, Расписание D, Расписание E EIC , Расписание F, Расписание F, Расписание J, Расписание J, Расписание R, SE Расписание, Расписание. |
Модель налога США 1040 |
Банковский оператор | Вы хотите извлечь ключевую информацию из банковского оператора США | \Банковский оператор |
Банковский контроль | Вы хотите извлечь ключевые сведения из проверяемого документа. | Банковский контроль |
Контракт (юридическое соглашение между сторонами). | Вы хотите извлечь сведения о соглашении о контракте, такие как стороны, даты и интервалы. | Модель контракта |
Карточка медицинского страхования или идентификатор медицинского страхования. | Вы хотите извлечь ключевые сведения, такие как страховщик, идентификатор члена, покрытие рецептов и номер группы. | Модель карты медицинского страхования |
Кредитная/дебетовая карта | Вы хотите извлечь банковские карты с ключами, такие как номер карты и имя банка. | Модель кредитной и дебетовой карты |
Свидетельство о браке | Вы хотите извлечь ключевые сведения из сертификатов о браке. | Модель сертификата о браке |
Инструкция "Счет" или "Выставление счетов" | Вы хотите извлечь ключевые сведения, такие как имя клиента, адрес выставления счетов и сумма. | Модель накладных |
Получение, ваучер или одностраничные квитанции об отеле. | Вы хотите извлечь ключевые сведения, такие как имя продавца, дата транзакции и общая сумма транзакций. | Модель получения |
Документ удостоверений (идентификатор), например водительская лицензия США или международный паспорт | Вы хотите извлечь ключевые сведения, такие как имя, фамилия, дата рождения, адрес и подпись. | Модель документа удостоверений (ID) |
Оплата заглушки | Вы хотите извлечь ключевые сведения из документа с заглушки оплаты. | Модель заглушки оплаты |
Ипотека США 1003 | Вы хотите извлечь ключевые сведения из приложения универсального жилищного кредита. | Модель формы 1003 |
Ипотека США 1004 | Вы хотите извлечь ключевые сведения из универсального отчета об оценке жилых домов (URAR). | Модель формы 1004 |
Ипотека США 1005 | Вы хотите извлечь ключевые сведения из формы проверки занятости | Модель формы 1005 |
Ипотека США 1008 | Вы хотите извлечь ключевые сведения из сводки по универсальному андеррайтингу и передаче. | Модель формы 1008 |
Раскрытие ипотечных кредитов США | Вы хотите извлечь ключевые сведения из формы раскрытия ипотеки. | Модель формы раскрытия ипотеки |
Документы смешанного типа со структурированными, полуструктурированными и (или) неструктурированными элементами | Вам нужно извлечь пары "ключ-значение", метки выбора, таблицы, поля подписи и выбранные регионы, не извлеченные предварительно созданной моделью или моделью документов общего назначения. | Пользовательская модель |
Совет
- Если вы по-прежнему не уверены, какая предварительно обученная модель используется, попробуйте использовать модель макета с включенным необязательным параметром
features=keyValuePairs
строки запроса. - Модель макета используется подсистемой чтения OCR для обнаружения страниц, таблиц, стилей, текста, строк, слов, расположений и языков.
Пользовательские модели извлечения
Обучающий набор | Примеры документов | Лучшее решение |
---|---|---|
Структурированные, согласованные документы со статическим макетом. | Структурированные формы, такие как анкеты или приложения. | Пользовательская модель шаблона |
Структурированные и полуструктурированные. | • Структурированные → опросы ● Полуструктурированные → счета |
Пользовательская нейронная модель |
Коллекция нескольких моделей, каждая из которых обучена на документах аналогичного типа. | • Поставки заказов на покупку оборудования ● Заказы на покупку оборудования ● Заказы на покупку мебели Все, состоящие в одной модели. |
Составная настраиваемая модель |
Пользовательская модель классификации
Обучающий набор | Примеры документов | Лучшее решение |
---|---|---|
По крайней мере два разных типа документов. | Формы, письма или документы | Пользовательская модель классификации |