Требования и ограничения для предварительно созданной обработки документов в SharePoint
В следующих разделах описываются ключевые факторы, которые следует учитывать при планировании использования предварительно созданной модели обработки документов.
Обработка контракта
Значок | Описание |
---|---|
![]() |
Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff. |
![]() |
Поддерживаемые языки Эта модель поддерживает только контракты на английском языке. |
![]() |
Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. |
![]() |
Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт. |
![]() |
Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели. |
Обработка счета
Значок | Описание |
---|---|
![]() |
Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff. |
![]() |
Поддерживаемые языки Эта модель поддерживает счета на английском, испанском, немецком, французском, итальянском, португальском и голландском языках. |
![]() |
Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. |
![]() |
Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт. |
![]() |
Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели. |
Обработка квитанций
Значок | Описание |
---|---|
![]() |
Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff. |
![]() |
Поддерживаемые языки Эта модель поддерживает квитанции на английском, хорватском, чешском, датском, голландском, финском, венгерском, итальянском, японском, латышском, литвском, норвежском, португальском, испанском, шведском и японском языках. |
![]() |
Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. |
![]() |
Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт. |
![]() |
Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели. |
Обработка конфиденциальной информации
Значок | Описание |
---|---|
![]() |
Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls и .xlsx. |
![]() |
Поддерживаемые языки Эта модель поддерживает следующие языки: см. раздел Поддерживаемые языки. Эта модель также поддерживает языки как для рукописного текста , так и для печатного текста. |
![]() |
Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. Поддерживает языки как для рукописного текста , так и для печатного текста. |
![]() |
Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт. |
![]() |
Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели. |
Простая обработка документов
Значок | Описание |
---|---|
![]() |
Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff. |
![]() |
Поддерживаемые языки Эта модель поддерживает документы на более чем 100 языках. |
![]() |
Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. |
![]() |
Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт. |
![]() |
Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели. |