开始在 Azure 上使用 Vision Studio

已完成

若要使用 Azure AI 视觉服务,必须先在 Azure 订阅中为其创建资源。 你可以使用以下两种资源中的任意一种:

  • Azure AI 视觉:视觉服务的一种特定资源。 如果你不打算使用任何其他 AI 服务,或者要单独跟踪 AI 视觉资源的利用率和成本,请使用此资源类型。
  • Azure AI 服务:包含 Azure AI 视觉以及其他许多 Azure AI 服务(例如 Azure AI 语言、Azure AI 语音等)的常规资源。 如果你计划使用多种 Azure AI 服务并希望简化管理和开发,请使用此资源类型。

创建资源后,可通过多种方式使用 Azure AI 视觉的读取 API:

  • Vision Studio
  • REST API
  • 软件开发工具包 (SDK):Python、C#、JavaScript

下面我们将重点介绍视觉工作室。

Azure AI 视觉工作室

Azure AI 视觉工作室允许通过图形用户界面访问 Azure AI 视觉 API,该界面不需要编码即可开始使用。

A screenshot showing the Vision Studio interface.

打开视觉工作室后,需要选择默认资源。 视觉工作室中的默认资源必须是 Azure AI 服务资源,而不是 Azure AI 视觉资源。

在视觉工作室主页中,可以选择“光学字符识别”和“从图像中提取文本”磁贴,以试用读取 OCR 引擎。 使用资源返回结果时,资源将开始产生使用费。 使用自己的某个文件或示例文件,你可以查看读取 OCR 引擎如何返回检测到的属性。 这些属性对应于计算机在边界框中检测到的内容。

A screenshot showing the detected attributes.

在幕后,将分析图像中的特征(包括人员、文本和对象),并用边界框进行标记。 检测到的信息将得到处理,结果将返回给用户。 原始结果以 JSON 形式返回,其中包含有关页面上边界框的位置和检测到的文本的信息。 请记住,Vision Studio 可以返回 OCR 示例,但若要生成自己的 OCR 应用程序,你需要使用 SDK 或 REST API。

A screenshot showing bounding boxes and the related json returned.