Поделиться через


Требования и ограничения для предварительно созданной обработки документов в SharePoint

В следующих разделах описываются ключевые факторы, которые следует учитывать при планировании использования предварительно созданной модели обработки документов.

Обработка контракта

Значок Описание
Символ файлов. Поддерживаемые типы файлов
Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
Символ беседы. Поддерживаемые языки
Эта модель поддерживает только контракты на английском языке.
Символ абзаца. Рекомендации по распознаванию текста
Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям:
— формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок.
— Для .pdf и .tiff файлов можно обработать до 2000 страниц.
— Размер файла должен быть меньше 50 МБ.
— Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей.
— Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше.
— Общий размер обучающих данных составляет 500 страниц или меньше.
Символ глобуса. Среды с поддержкой нескольких регионов
При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
Символ объектов. Библиотеки с несколькими моделями
Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка счета

Значок Описание
Символ файлов. Поддерживаемые типы файлов
Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
Символ беседы. Поддерживаемые языки
Эта модель поддерживает счета на английском, испанском, немецком, французском, итальянском, португальском и голландском языках.
Символ абзаца. Рекомендации по распознаванию текста
Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям:
— формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок.
— Для .pdf и .tiff файлов можно обработать до 2000 страниц.
— Размер файла должен быть меньше 50 МБ.
— Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей.
— Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше.
— Общий размер обучающих данных составляет 500 страниц или меньше.
Символ глобуса. Среды с поддержкой нескольких регионов
При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
Символ объектов. Библиотеки с несколькими моделями
Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка квитанций

Значок Описание
Символ файлов. Поддерживаемые типы файлов
Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
Символ беседы. Поддерживаемые языки
Эта модель поддерживает квитанции на английском, хорватском, чешском, датском, голландском, финском, венгерском, итальянском, японском, латышском, литвском, норвежском, португальском, испанском, шведском и японском языках.
Символ абзаца. Рекомендации по распознаванию текста
Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям:
— формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок.
— Для .pdf и .tiff файлов можно обработать до 2000 страниц.
— Размер файла должен быть меньше 50 МБ.
— Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей.
— Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше.
— Общий размер обучающих данных составляет 500 страниц или меньше.
Символ глобуса. Среды с поддержкой нескольких регионов
При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
Символ объектов. Библиотеки с несколькими моделями
Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка конфиденциальной информации

Значок Описание
Символ файлов. Поддерживаемые типы файлов
Эта модель поддерживает следующие типы файлов: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls и .xlsx.
Символ беседы. Поддерживаемые языки
Эта модель поддерживает следующие языки: см. раздел Поддерживаемые языки.
Эта модель также поддерживает языки как для рукописного текста , так и для печатного текста.
Символ абзаца. Рекомендации по распознаванию текста
Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям:
— формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок.
— Для .pdf и .tiff файлов можно обработать до 2000 страниц.
— Размер файла должен быть меньше 50 МБ.
— Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей.
— Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше.
— Общий размер обучающих данных составляет 500 страниц или меньше.
Поддерживает языки как для рукописного текста , так и для печатного текста.
Символ глобуса. Среды с поддержкой нескольких регионов
При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
Символ объектов. Библиотеки с несколькими моделями
Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Простая обработка документов

Значок Описание
Символ файлов. Поддерживаемые типы файлов
Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
Символ беседы. Поддерживаемые языки
Эта модель поддерживает документы на более чем 100 языках.
Символ абзаца. Рекомендации по распознаванию текста
Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям:
— формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок.
— Для .pdf и .tiff файлов можно обработать до 2000 страниц.
— Размер файла должен быть меньше 50 МБ.
— Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей.
— Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше.
— Общий размер обучающих данных составляет 500 страниц или меньше.
Символ глобуса. Среды с поддержкой нескольких регионов
При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
Символ объектов. Библиотеки с несколькими моделями
Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.