Требования и ограничения для предварительно созданной обработки документов в SharePoint

Статья
01/23/2025

В следующих разделах описываются ключевые факторы, которые следует учитывать при планировании использования предварительно созданной модели обработки документов.

Обработка контракта

Значок	Описание
	Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
	Поддерживаемые языки Эта модель поддерживает только контракты на английском языке.
	Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше.
	Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
	Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка счета

Значок	Описание
	Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
	Поддерживаемые языки Эта модель поддерживает счета на английском, испанском, немецком, французском, итальянском, португальском и голландском языках.
	Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше.
	Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
	Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка квитанций

Значок	Описание
	Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
	Поддерживаемые языки Эта модель поддерживает квитанции на английском, хорватском, чешском, датском, голландском, финском, венгерском, итальянском, японском, латышском, литвском, норвежском, португальском, испанском, шведском и японском языках.
	Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше.
	Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
	Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Обработка конфиденциальной информации

Значок	Описание
	Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls и .xlsx.
	Поддерживаемые языки Эта модель поддерживает следующие языки: см. раздел Поддерживаемые языки. Эта модель также поддерживает языки как для рукописного текста , так и для печатного текста.
	Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше. Поддерживает языки как для рукописного текста , так и для печатного текста.
	Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
	Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.

Простая обработка документов

Значок	Описание
	Поддерживаемые типы файлов Эта модель поддерживает следующие типы файлов: .bmp, .jpeg, .pdf, .png и .tiff.
	Поддерживаемые языки Эта модель поддерживает документы на более чем 100 языках.
	Рекомендации по распознаванию текста Эта модель использует технологию оптического распознавания символов (OCR) для сканирования файлов .pdf, файлов изображений и файлов .tiff. Обработка с помощью технологии распознавания текста лучше всего работает с документами, которые соответствуют следующим требованиям: — формат файла .jpg, .png или .pdf (текстовый или отсканированный). Внедренные в текст .pdf файлы лучше, так как при извлечении символов и расположении не будет ошибок. — Для .pdf и .tiff файлов можно обработать до 2000 страниц. — Размер файла должен быть меньше 50 МБ. — Для изображений размеры должны быть от 50 x 50 до 10 000 x 10 000 пикселей. — Для файлов .pdf размеры должны быть не более 11 x 17 дюймов, что соответствует размерам бумаги Legal или A3 и меньше. — Общий размер обучающих данных составляет 500 страниц или меньше.
	Среды с поддержкой нескольких регионов При настройке Syntex в среде Microsoft 365 с несколькими регионами можно настроить только для использования типа модели в центральном расположении. Если вы хотите использовать этот тип модели в спутниковом расположении, обратитесь в службу поддержки Майкрософт.
	Библиотеки с несколькими моделями Если две или более обученных моделей применяются к одной библиотеке, файл классифицируется с помощью модели, которая имеет самый высокий средний показатель достоверности. Извлеченные сущности относятся только к примененной модели.