SharePoint 中结构化和任意格式文档处理的要求和限制

以下部分概述了在计划使用结构化或任意格式文档处理模型时要考虑的关键因素。

结构化文档处理

图标 说明
文件符号。 支持的文件类型
此模型支持以下文件类型:请参阅 文件类型要求
对话符号。 支持的语言
此模型支持以下语言:请参阅 固定模板文档的模型
段落符号。 OCR 注意事项
此模型使用光学字符识别 (OCR) 技术扫描 .pdf 文件、图像文件和.tiff文件。 OCR 处理最适合满足 这些要求的文档。
带宽/效率符号。 优化提示
如果模型未按所需方式执行,请尝试 以下步骤来提高模型的性能
地球符号。 多地理环境
Microsoft 365 多地理位置 环境中设置 Syntex 时,只能将其配置为在中心位置使用模型类型。 如果要在附属位置使用此模型类型,请联系Microsoft支持人员。
块符号。 自定义 Power Platform 环境
如果使用自定义环境 (而不是默认环境) 进行 Power Platform 处理,则还有其他设置要求。 有关详细信息,请参阅 自定义 Power Platform 环境
对象符号。 多模型库
如果两个或更多已训练的模型应用于同一个库,则使用具有最高平均置信度分数的模型对文件进行分类。 提取的实体仅来自应用的模型。 每个库只能有一个任意多边形或一个结构化模型。

任意格式文档处理

图标 说明
文件符号。 支持的文件类型
此模型支持以下文件类型:请参阅 文件类型要求
对话符号。 支持的语言
此模型支持以下语言:请参阅 通用文档模型
段落符号。 OCR 注意事项
此模型使用光学字符识别 (OCR) 技术扫描 .pdf 文件、图像文件和.tiff文件。 OCR 处理最适合满足 这些要求的文档。
带宽/效率符号。 优化提示
如果模型未按所需方式执行,请尝试 以下步骤来提高模型的性能
地球符号。 多地理环境
Microsoft 365 多地理位置 环境中设置 Syntex 时,只能将其配置为在中心位置使用模型类型。 如果要在附属位置使用此模型类型,请联系Microsoft支持人员。
块符号。 自定义 Power Platform 环境
如果使用自定义环境 (而不是默认环境) 进行 Power Platform 处理,则还有其他设置要求。 有关详细信息,请参阅 自定义 Power Platform 环境
对象符号。 多模型库
如果两个或更多已训练的模型应用于同一个库,则使用具有最高平均置信度分数的模型对文件进行分类。 提取的实体仅来自应用的模型。 每个库只能有一个任意多边形或一个结构化模型。