你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是 Azure OpenAI 服务?

Azure OpenAI 服务提供对 OpenAI 强大语言模型的 REST API 访问,这些模型包括 o1、o1-mini、GPT-4o、GPT-4o mini、支持视觉的 GPT-4 Turbo、GPT-4、GPT-3.5-Turbo 和嵌入模型系列。 这些模型可以轻松适应特定的任务,包括但不限于内容生成、汇总、图像理解、语义搜索和自然语言到代码的转换。 用户可以通过 REST API、Python SDK 或在 Azure AI Foundry 中访问该服务。

功能概述

功能 Azure OpenAI
可用的模型 o1 和 o1-mini -(有限的访问权限 - 请求访问权限
GPT-4o 和 GPT-4o mini
GPT-4 系列(包括 GPT-4 Turbo with Vision)
GPT-35-Turbo 系列
Embeddings 系列
模型页中了解详细信息。
微调 GPT-4o-mini(预览版)
GPT-4(预览版)
GPT-3.5-Turbo (0613)
babbage-002
davinci-002
价格 此处提供
有关已启用视觉的聊天模型的详细信息,请参阅特殊的定价信息
虚拟网络支持和专用链接支持 是的。
托管标识 是,通过 Microsoft Entra ID
UI 体验 用于帐户和资源管理的 Azure 门户
用于模型探索和微调的 Azure AI Foundry
模型区域可用性 模型可用性
内容筛选 使用自动化系统根据内容策略评估提示和完成情况。 将筛选高严重性内容。

负责任 AI

Microsoft 致力于遵照“以人为本”的原则推动 AI 的进步。 生成性模型(例如 Azure OpenAI 中提供的模型)提供显著的潜在优势,但如果不经过精心设计和采用全方位的缓解措施,此类模型有可能会生成错误甚至有害的内容。 Microsoft 已进行了大量投资来帮助防范滥用和意外损害,其中包括融入 Microsoft 的负责任 AI 使用原则,采用服务使用行为准则,生成内容筛选器以支持客户,以及提供客户在使用 Azure OpenAI 时应考虑的负责任 AI 信息和指导

开始使用 Azure OpenAI 服务

若要开始使用 Azure OpenAI 服务,需要在 Azure 订阅中创建 Azure OpenAI 服务资源。

请首先查看以下指南:创建和部署 Azure OpenAI 服务资源

  1. 可以通过 Azure 门户、Azure CLI 或 Azure PowerShell 创建资源。

  2. 拥有 Azure OpenAI 服务资源时,可以部署 GPT-4o 等模型。

  3. 部署模型后,可以:

    • 试用 Azure AI Foundry 门户操场,探索模型的功能。
    • 还可以使用 REST API 或 SDK 开始对服务进行 API 调用。

    例如,你可以在操场上或通过代码试用实时音频助手功能。

注意

为了访问某些 Azure OpenAI 服务模型或功能,需要填写有限访问权限注册表单。 在 Azure OpenAI 有限访问页上了解详细信息。

比较 Azure OpenAI 和 OpenAI

Azure OpenAI 服务通过 OpenAI GPT-4、GPT-3、Codex、DALL-E、Whisper 和文本转语音模型为客户提供高级语言 AI,并能够实现 Azure 的安全性和企业承诺。 Azure OpenAI 与 OpenAI 共同开发 API,确保兼容性的同时能够实现二者之间的平稳过渡。

使用 Azure OpenAI,客户可在运行与 OpenAI 相同的模型时获得 Microsoft Azure 的安全功能。 Azure OpenAI 提供专用网络、区域可用性和负责任 AI 内容筛选功能。

关键概念

提示和补全

补全终结点是 API 服务的核心组件。 此 API 提供对模型的文本输入、文本输出接口的访问。 用户只需提供一个包含英文文本命令的输入提示,模型就会生成文本补全内容。

下面是一个简单的提示和补全的示例:

提示:""" count to 5 in a for loop """

补全:for i in range(1, 6): print(i)

令牌

文本标记

Azure OpenAI 通过将文本分解为标记来处理文本。 标记可以是单词,也可以是字符块。 例如,单词“hamburger”将分解为标记“ham”、“bur”和“ger”,而“pear”之类的常见短单词只是一个单个标记。 许多标记以空格开头,例如“ hello”和“ bye”。

在给定请求中处理的标记总数取决于输入、输出和请求参数的长度。 处理的标记数量也会影响模型的响应延迟和吞吐量。

图像标记

Azure OpenAI 的图像处理功能结合了 GPT-4o、GPT-4o mini 和带视觉模型的 GPT-4 Turbo,通过图像词汇切分来确定图像输入所消耗的总标记数。 消耗的标记数基于两个主要因素进行计算:图像的细节级别(低或高)和图像的维度。 以下是标记成本的计算方式:

  • 低分辨率模式
    • 低细节级别允许 API 在不需要高分辨率图像分析的场景中返回更快速的响应。 低细节图像消耗的标记包括:
      • GPT-4o 和具有视觉的 GPT-4 Turbo:每张图像消耗固定的 85 个标记,不论图像大小
      • GPT-4o mini:每张图像消耗固定的 2833 个标记,不论图像大小
    • 示例:4096 x 8192 图像(低细节):对于 GPT-4o,成本为固定的 85 个标记,因为它是一个低细节图像,大小不会影响此模式下的成本。
  • 高分辨率模式
    • 如果是高细节,则允许 API 更详细地分析图像。 图像标记数根据图像的尺寸进行计算。 计算涉及以下步骤:
      1. 调整图像大小:调整图像大小,使其适应 2048 x 2048 像素的正方形范围。 如果图像的最短边超过 768 像素,则进一步调整图像大小,使最短边为 768 像素长。 调整大小期间保留纵横比。
      2. 图块计算:调整大小后,将图像划分为 512 x 512 像素的图块。 任何部分图块都将向上舍入为完整图块。 图块数决定了标记总成本。
      3. 标记计算
        • GPT-4o 和具有视觉的 GPT-4 Turbo:每个 512 x 512 像素的图块消耗 170 个标记。 总计中会额外增加 85 个基础标记
        • GPT-4o mini:每个 512 x 512 像素的图块消耗 5667 个标记。 总计中会额外增加 2833 个基础标记
    • 示例:2048 x 4096 图像(高细节)
      1. 最初将图像调整为 1024 x 2048 像素,以适应 2048 x 2048 像素的正方形范围。
      2. 进一步将图像调整为 768 x 1536 像素,以确保最短边的长度不超过 768 像素。
      3. 将图像划分为 2 x 3 的图块,每个图块为 512 x 512 像素。
      4. 最终计算
        • 对于 GPT-4o 和具有视觉的 GPT-4 Turbo,标记总成本为 6 个图块 x 170 个标记/图块 + 85 个基础标记 = 1105 个标记。
        • 对于 GPT-4o mini,标记总成本为 6 个图块 x 5667 个标记/图块 + 2833 个基础标记 = 36835 个标记。

资源

Azure OpenAI 是 Azure 上的一个新产品。 可以在 Azure 订阅中像使用任何其他 Azure 产品一样通过创建资源或服务实例开始使用 Azure OpenAI。 可以阅读有关 Azure 的资源管理设计的详细信息。

部署

创建 Azure OpenAI 资源后,必须先部署模型,然后才能开始发出 API 调用和生成文本。 可以使用部署 API 来完成此操作。 这些 API 允许指定要使用的模型。

提示设计

OpenAI 的 GPT-3、GPT-3.5 和 GPT-4 模型都是基于提示的。 使用基于提示的模型时,用户通过输入文本提示与模型交互,该文本提示通过文本补全进行响应。 补全是模型的输入文本的延续。

虽然这些模型很强大,但它们的行为对提示也很敏感。 这使得提示工程成为一项重要的开发技能。

提示构造可能很困难。 在实践中,提示的作用是配置模型权重以完成所需的任务,但它更像艺术而不是科学,通常需要经验和直觉来制作成功的提示。

模型

该服务为用户提供对多种不同模型的访问。 每种模型提供不同的功能和价位。

DALL-E 模型(有一些为预览版,请参阅模型)基于用户提供的文本提示生成图像。

Whisper 模型可用于将语音转录并翻译成文本。

文本转语音模型(目前为预览版)可用于将文本合成为语音。

模型概念页上详细了解每个模型。

后续步骤

详细了解为 Azure OpenAI 提供支持的基础模型