探索用于读取文本的 Azure AI 视觉选项

已完成

Azure AI 提供了两种不同的功能,用于从文档和图像中读取文本,一个在 Azure AI 视觉服务中,另一个在 Azure AI 文档智能中。 两种服务提供的内容存在重叠,但根据输入的内容,每个服务都针对结果进行了优化。

  • 图像分析光学字符识别 (OCR):
    • 对包含少文本的常规非结构化文档或包含文本的图像使用此功能。
    • 结果立即从单个 API 调用返回(同步)。
    • 具有分析提取文本后的图像的功能,包括对象检测、描述或分类图像、生成智能裁剪的缩略图等。
    • 示例包括:街道标志、手写笔记和商店标志。
  • 文档智能:
    • 使用此服务可以从图像和 PDF 文档中读取少量到大量的文本。
    • 此服务使用文档的上下文和结构来提高准确性。
    • 初始函数调用返回一个异步操作 ID,必须在后续调用中使用此 ID 来检索结果。
    • 示例包括:收据、文章和发票。

可以通过 REST API 或客户端库来访问这两种技术。 在本模块中,我们将重点介绍“图像分析”中的 OCR 功能。 若要了解有关文档智能的详细信息,本模块将提供很好的介绍。