探索用于读取文本的 Azure AI 视觉选项

3 分钟

Azure AI 提供了两种不同的功能，用于从文档和图像中读取文本，一个在 Azure AI 视觉服务中，另一个在 Azure AI 文档智能中。两种服务提供的内容存在重叠，但根据输入的内容，每个服务都针对结果进行了优化。

图像分析光学字符识别 (OCR)：
- 对包含少文本的常规非结构化文档或包含文本的图像使用此功能。
- 结果立即从单个 API 调用返回（同步）。
- 具有分析提取文本后的图像的功能，包括对象检测、描述或分类图像、生成智能裁剪的缩略图等。
- 示例包括：街道标志、手写笔记和商店标志。
文档智能：
- 使用此服务可以从图像和 PDF 文档中读取少量到大量的文本。
- 此服务使用文档的上下文和结构来提高准确性。
- 初始函数调用返回一个异步操作 ID，必须在后续调用中使用此 ID 来检索结果。
- 示例包括：收据、文章和发票。

可以通过 REST API 或客户端库来访问这两种技术。在本模块中，我们将重点介绍“图像分析”中的 OCR 功能。若要了解有关文档智能的详细信息，本模块将提供很好的介绍。