Обзор предварительно созданной обработки документов в Microsoft Syntex
Примечание.
До июня 2025 г. вы можете опробовать ограниченный объем предварительно созданной обработки документов и других выбранных служб Syntex бесплатно, если настроено выставление счетов с оплатой по мере использования . Сведения и ограничения см. в статье Опробовать Microsoft Syntex и изучить его службы.
Помимо пользовательских моделей, Microsoft Syntex предоставляет предварительно созданные модели для автоматизации извлечения информации.
Примечание.
Корпорация Майкрософт уважает конфиденциальность и право владения данными, используемыми для обучения и обработки моделей в Syntex. Ни одна из данных вашей организации не используется или не передается корпорацией Майкрософт для обучения моделей ИИ, моделей с большим языком или любых других моделей. Данные остаются в безопасном состоянии в клиенте вашей организации. Дополнительные сведения см. в статье Защита и конфиденциальность данных Майкрософт.
Общие сведения о предварительно созданных моделях
В предварительно созданной обработке документов используются предварительно созданные модели , предварительно настроенные для распознавания документов и структурированной информации в документах. Вместо того, чтобы создавать новую пользовательскую модель с нуля, можно выполнить итерацию по существующей предварительно обученной модели, чтобы добавить определенные поля, которые соответствуют потребностям вашей организации.
Предварительно созданные модели используют оптическое распознавание символов (OCR) в сочетании с моделями глубокого обучения для идентификации и извлечения предопределенных полей текста и данных, общих для определенных типов документов. Сначала нужно проанализировать один из файлов по предварительно созданной модели. Затем вы выбираете обнаруженные поля, которые будут нужны для вашей цели. Если модель не обнаруживает необходимые поля, можно выполнить анализ еще раз с помощью другого файла.
Как и другие модели, предварительно созданные модели создаются и управляются в центре содержимого. При применении к библиотеке документов SharePoint модель связана с типом контента и содержит столбцы для хранения извлекаемых сведений.
После публикации своей модели используйте центр управления контентом, чтобы применить ее к любой библиотеке документов SharePoint, к которой у вас есть доступ.
Доступные предварительно созданные модели
В настоящее время доступно пять готовых моделей обработки: контракты, счета, квитанции, конфиденциальная информация и простой документ.
Контракты. Предварительно созданная модель обработки контрактов анализирует и извлекает ключевую информацию из документов контракта. API анализирует контракты в различных форматах и извлекает ключевые сведения о контракте, такие как имя и адрес клиента, длительность контракта и дата продления.
Счета. Модель обработки счетов анализирует и извлекает ключевую информацию из счетов-фактур. API анализирует счета в различных форматах и извлекает ключевые сведения о счете , такие как имя клиента, адрес выставления счетов, дата выполнения и сумма.
Квитанции. Модель обработки квитанций анализирует и извлекает ключевую информацию из квитанций о продажах. API анализирует печатные и рукописные квитанции и извлекает ключевые сведения о квитанциях , такие как имя продавца, номер телефона продавца, дата транзакции, налог и итог транзакции.
Конфиденциальная информация. Модель конфиденциальной информации анализирует, обнаруживает и извлекает ключевую информацию из документов. API анализирует документы в различных форматах, обнаруживает и извлекает ключевую конфиденциальную информацию, такую как личные и финансовые идентификационные номера, физические адреса и адреса электронной почты, а также номера телефонов.
Простой документ. Простая модель обработки документов предлагает гибкое предварительно обученное решение для извлечения пар "ключ—значение", меток выделения и именованных сущностей из базовых структурированных документов. Эта модель также поддерживает штрихкоды и обнаружение языка.
В будущих выпусках будут доступны дополнительные предварительно созданные модели.
Требования и ограничения
Сведения о требованиях, которые следует учитывать при выборе этой модели, см. в разделе Требования и ограничения для предварительно созданной обработки документов.