Microsoft Syntex中的结构化和任意格式文档处理概述
注意
到 2025 年 6 月,如果设置了即用即付计费,则可以免费试用有限数量的结构化和自由格式文档处理和其他选定的 Syntex 服务。 有关信息和限制,请参阅试用Microsoft Syntex并浏览其服务。
使用结构化文档处理模型 (布局方法) 自动标识字段和表值。 它最适合结构化或半结构化文档,例如表单和发票。
使用任意格式文档处理模型 (任意多边形选择方法) 自动从非结构化文档和任意格式文档(如字母和合同)中提取信息。
注意
Microsoft尊重用于在 Syntex 中训练和处理模型的数据的隐私和所有权。 Microsoft使用或传输任何组织数据来训练 AI 模型、大语言模型或任何其他模型。 数据安全地保留在组织的租户中。 有关详细信息,请参阅 Microsoft数据保护和隐私。
结构化模型和任意多边形模型简介
Microsoft Syntex使用 Microsoft Power Apps AI Builder 文档处理 (以前称为表单处理) 在 SharePoint 文档库中创建结构化和任意格式的文档处理模型。
可以使用 AI Builder 文档处理来创建结构化或自由格式的文档处理模型,这些模型使用机器学习技术识别和提取结构化或半结构化文档(如表单和发票)以及非结构化或任意格式文档(如合同和信件)中的键值对和表数据。
组织通常从各种来源(如邮件、传真和电子邮件)接收大量发票。 处理这些文档并手动将其输入数据库可能需要相当长的时间。 通过使用 AI 从文档中提取文本、键值对和表,Syntex 可自动执行此过程。
例如,可以创建一个结构化或任意格式的文档处理模型,用于标识上传到文档库的所有文档。 然后,可以从每个文档中提取并显示对你很重要的特定数据。
你可以使用示例文件来训练模型,并定义将从表单提取的信息。 文档的布局通过培训你的模型获知。 只需 5 个表单文档即可开始操作。 Syntex 将分析键值对的示例文件,还可以手动识别可能未检测到的文件。 可通过 AI 生成器测试示例文件的模型准确性。
只能在启用它的 SharePoint 文档库中创建结构化或任意格式的文档处理模型。 如果已启用,则可以在文档库中看到 “分类和提取 ”选项。
如果需要在文档库上启用它,请联系 Microsoft 365 管理员。
要求和限制
有关选择此模型时要考虑的要求的信息,请参阅 Microsoft Syntex 中模型的要求和限制。