你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

应该选择哪个模型?

Azure AI 文档智能支持多种模型,因此可以将智能文档处理添加到应用程序,并对工作流进行优化。 选择正确的模型对于确保企业取得成功至关重要。 在本文中,我们将探索可用的文档智能模型,并提供有关如何为项目选择最佳解决方案的指导。

以下决策图表突出显示了每个受支持的模型的功能,以帮助你选择最符合你的应用程序需求和要求的模型。

重要

请务必查看支持的语言页面,了解支持的语言文本和按功能提取的字段。

预训练的文档分析模型

文档类型 示例 要提取的数据 最佳解决方案
通用文档. 合同或信件。 你希望提取的主要是书面或打印的文本行、字词、位置和检测到的语言。 读取 OCR 模型
包含结构信息的文档 报告或研究。 除了书面或打印文本,还需要提取结构信息,例如表格、选择标记、段落、标题、标题和副标题。 布局分析模型
结构化或半结构化文档,其中包含格式化为字段(键)和值的内容。 表单或文档,这是企业或行业中常用的标准化格式,例如信用申请或调查。 你需要提取字段和值,包括场景特定的预生成模型未涵盖的字段和值, 而无需训练自定义模型。 **启用了可选查询字符串参数 features=keyValuePairs 的布局分析模型**

预训练的特定于方案的模型

文档类型 要提取的数据 最佳解决方案
美国统一税 你想要从单个文件中提取 W2、1040、1090、1098 所有税务表单的关键信息,而无需运行任何你自己的自定义分类。 美国统一税务模型
美国税务 W-2 税款 你希望提取关键信息,如薪酬、工资和预扣税款。 美国税务 W-2 模型
美国税务 W-4 税款 你想要提取关键信息,例如索赔调整、个人信息。 美国税务 W-4 模型
美国税务 1095(A,C) 你想要提取保费税收抵免、预付款抵免详细信息。 美国税务 1095 模型
美国税务 1098 你想要提取抵押贷款利息详细信息,如本金、积分和税款。 美国税务 1098 表
美国税务 1098-E 你想要提取学生贷款利息详细信息,例如贷款人和利息金额。 美国税务 1098-E 表
美国税务 1098T 你想要提取符合条件的学费详细信息,例如奖学金调整、学生身份和贷款人信息。 美国税务 1098-T 模型
美国税务 1099(变体) 你想要从 1099 表单及其变体(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)中提取信息。 美国税务 1099 模型
美国税务 1040(变体) 你想要从 1040 表单及其变体中提取信息(单据 1、单据 2、单据 3、单据 8812、单据 A、单据 B、单据 C、单据 D、单据 E、单据 EIC、单据 F、单据 H、单据 J、单据 R、单据 SE、单据高级)。 美国税务 1040 模型
银行对帐单 你想要从美国银行对帐单中提取关键信息 \银行对帐单
银行支票 你想要从支票文档中提取关键信息。 银行支票
合同(相关方之间的法律协议)。 你想要提取合同协议详细信息,例如参与方、日期和间隔。 合同模型
保险卡或医疗保险 ID 你希望提取关键信息,例如保险公司、会员 ID、处方保险和团体。 医疗保险卡模型
信用卡/借记卡 你想要提取关键信息银行卡,如卡号和银行名称。 信用卡/借记卡模型
结婚证 你想要从结婚证中提取关键信息。 结婚证模型
发票或计费帐单 你希望提取关键信息,例如客户姓名、帐单邮寄地址和到期金额。 发票模型
收据、代金券或单页酒店收据。 你希望提取关键信息,如商家名称、交易日期和交易总额。 收据模型
身份证件 (ID),例如美国驾照或国际护照 你想要提取名字、姓氏、出生日期、地址和签名等关键信息。 身份证件 (ID) 模型
工资单 你想要从工资单文档中提取关键信息。 工资单模型
美国抵押贷款 1003 你想要从统一住宅贷款申请表中提取关键信息。 1003 表单模型
美国抵押贷款 1004 你想要从统一住宅评估报告 (URAR) 中提取关键信息。 1004 表单模型
美国抵押贷款 1005 你想要从在职证明表单中提取关键信息 1005 表单模型
美国抵押贷款 1008 你想要从统一认购和传输汇总表中提取关键信息。 1008 表单模型
美国按揭过户信息披露 你想要从按揭过户信息披露表单中提取关键信息。 按揭过户信息披露表单模型
包含结构化、半结构化和/或非结构化元素的混合型文档 你想要提取未由预生成或常规文档模型提取的键值对、选择标记、表、签名字段和选定区域。 自定义模型

提示

  • 如果你仍不确定要使用哪个预先训练的模型,请在启用可选的查询字符串参数 features=keyValuePairs 的情况下尝试“布局模型”
  • 布局模型由“读取 OCR”引擎提供支持,用于检测页面、表、样式、文本、行、字词、位置和语言。

自定义提取模型

训练集 示例文档 最佳解决方案
具有静态布局的结构化、一致的文档 结构化表单,例如问卷或申请。 自定义模板模型
结构化和半结构化 ● 结构化 → 调查表
● 半结构化 → 发票
自定义神经模型
几个模型的集合,每个模型都在相似类型的文档上进行训练 ● 日用品采购订单
● 设备采购订单
● 家具采购订单
全部组合成一个模型
组合自定义模型

自定义分类模型

训练集 示例文档 最佳解决方案
至少两种类型的文档 窗体、字母或文档 自定义分类模型

后续步骤