你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是 Azure OpenAI 服务?

Azure OpenAI 服务提供对 OpenAI 强大语言模型的 REST API 访问,这些模型包括 GPT-4o、支持视觉的 GPT-4 Turbo、GPT-4、GPT-3.5-Turbo 和嵌入模型系列。 这些模型可以轻松适应特定的任务,包括但不限于内容生成、汇总、图像理解、语义搜索和自然语言到代码的转换。 用户可以通过 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面访问该服务。

功能概述

功能 Azure OpenAI
可用的模型 GPT-4o 和 GPT-4o mini
GPT-4 系列(包括 GPT-4 Turbo with Vision)
GPT-35-Turbo 系列
Embeddings 系列
模型页中了解详细信息。
微调 GPT-4o-mini(预览版)
GPT-4(预览版)
GPT-3.5-Turbo (0613)
babbage-002
davinci-002
价格 此处提供
有关 GPT-4 Turbo with Vision 的详细信息,请参阅特殊定价信息
虚拟网络支持和专用链接支持 是,除非对数据使用 Azure OpenAI
托管标识 是,通过 Microsoft Entra ID
UI 体验 用于帐户和资源管理的 Azure 门户
用于模型探索和微调的 Azure OpenAI Service Studio
模型区域可用性 模型可用性
内容筛选 使用自动化系统根据内容策略评估提示和完成情况。 将筛选高严重性内容。

负责任的 AI

Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。 生成性模型(例如 Azure OpenAI 中提供的模型)提供显著的潜在优势,但如果不经过精心设计和采用全方位的缓解措施,此类模型有可能会生成错误甚至有害的内容。 Microsoft 已进行了大量投资来帮助防范滥用和意外损害,其中包括融入 Microsoft 的负责任 AI 使用原则,采用服务使用行为准则,生成内容筛选器以支持客户,以及提供客户在使用 Azure OpenAI 时应考虑的负责任 AI 信息和指导

如何访问 Azure OpenAI?

访问大多数 Azure OpenAI 模型不需要有限访问注册表单。 在 Azure OpenAI 有限访问页上了解详细信息。

比较 Azure OpenAI 和 OpenAI

Azure OpenAI 服务通过 OpenAI GPT-4、GPT-3、Codex、DALL-E、Whisper 和文本转语音模型为客户提供高级语言 AI,并能够实现 Azure 的安全性和企业承诺。 Azure OpenAI 与 OpenAI 共同开发 API,确保兼容性的同时能够实现二者之间的平稳过渡。

使用 Azure OpenAI,客户可在运行与 OpenAI 相同的模型时获得 Microsoft Azure 的安全功能。 Azure OpenAI 提供专用网络、区域可用性和负责任 AI 内容筛选功能。

关键概念

提示和补全

补全终结点是 API 服务的核心组件。 此 API 提供对模型的文本输入、文本输出接口的访问。 用户只需提供一个包含英文文本命令的输入提示,模型就会生成文本补全。

下面是一个简单的提示和补全的示例:

提示:""" count to 5 in a for loop """

补全:for i in range(1, 6): print(i)

令牌

文本标记

Azure OpenAI 通过将文本分解为标记来处理文本。 标记可以是单词,也可以是字符块。 例如,单词“hamburger”将分解为标记“ham”、“bur”和“ger”,而“pear”之类的常见短单词只是一个单个标记。 许多标记以空格开头,例如“ hello”和“ bye”。

给定请求中处理的标记总数取决于输入、输出和请求参数的长度。 处理的标记数量也会影响模型的响应延迟和吞吐量。

图像标记(GPT-4 Turbo with Vision 和 GPT-4o)

输入图像的标记成本取决于两个主要因素:图像的大小以及用于每个图像的细节设置(低或高)。 下面是其工作原理的明细:

  • 细节:低分辨率模式

    • 通过低细节,API 可以返回更快的响应,并且对于不需要高细节的用例,可以使用更少的输入标记。
    • 无论图像大小如何,这些图像分别消耗 85 个标记。
    • 示例:4096 x 8192 图像(低细节):成本为固定的 85 个标记,因为它是一个低细节图像,并且大小不会影响此模式下的成本。
  • 细节:高分辨率模式

    • 利用高细节,API 可以通过将图像裁剪为较小的方块更详细地查看图像。 每个方块可使用更多标记来生成文本。
    • 标记成本由一系列缩放步骤计算得出:
      1. 首先缩放图像,以适合 2048 x 2048 方形,同时保持其纵横比。
      2. 然后纵向缩减图像,以将其最短的一边长度缩放至 768 像素。
      3. 将图像分为 512 像素方形图块,这些图块(部分图块向上舍入)的数量决定了最终成本。 每个图块的成本为 170 个标记。
      4. 总成本中会额外增加 85 个标记。
    • 示例:2048 x 4096 图像(高细节)
      1. 初始重设大小为 1024 x 2048 以适应 2048 方块。
      2. 再进一步调整为 768 x 1536。
      3. 需要 6 个 512px 图块才能覆盖。
      4. 总成本是 170 × 6 + 85 = 1105 个标记。

资源

Azure OpenAI 是 Azure 上的一个新产品。 可以在 Azure 订阅中像使用任何其他 Azure 产品一样通过创建资源或服务实例开始使用 Azure OpenAI。 可以阅读有关 Azure 的资源管理设计的详细信息。

部署

创建 Azure OpenAI 资源后,必须先部署模型,然后才能开始发出 API 调用和生成文本。 可以使用部署 API 来完成此操作。 这些 API 允许指定要使用的模型。

提示设计

OpenAI 中的 GPT-3、GPT-3.5 和 GPT-4 模型是基于提示的。 使用基于提示的模型时,用户通过输入文本提示与模型交互,该文本提示通过文本补全进行响应。 补全是模型的输入文本的延续。

虽然这些模型非常强大,但它们的行为对提示也非常敏感。 这使得提示工程成为一项重要的开发技能。

提示构造可能很困难。 在实践中,提示的作用是配置模型权重以完成所需的任务,但它更像艺术而不是科学,通常需要经验和直觉来制作成功的提示。

模型

该服务为用户提供对多种不同模型的访问。 每种模型提供不同的功能和价位。

DALL-E 模型(有一些为预览版,请参阅模型)基于用户提供的文本提示生成图像。

Whisper 模型可用于将语音转录并翻译成文本。

文本转语音模型(目前为预览版)可用于将文本合成为语音。

模型概念页上详细了解每个模型。

后续步骤

详细了解为 Azure OpenAI 提供支持的基础模型