你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI 服务中的新增功能有哪些

本文汇总了 Azure OpenAI 的最新版本和主要文档更新。

2024 年 12 月

o1 推理模型,供有限访问

现在可使用最新的 o1 模型进行 API 访问和模型部署。 需要完成注册,并且会根据 Microsoft 的资格条件授予访问权限。 之前申请并获得 o1-preview 访问权限的客户无需重新申请,因为他们会自动进入最新模型的候补名单。

请求访问:受限访问模型应用程序

若要详细了解高级 o1 系列模型,请参阅开始使用 o1 系列推理模型

上市区域

型号 区域
o1
(版本:2024-12-17)
美国东部 2(全球标准)
瑞典中部(全球标准)

偏好微调(预览版)

直接偏好优化 (DPO) 是一种用于大型语言模型的新对齐技术,旨在根据人类偏好调整模型权重。 与人工反馈强化学习 (RLHF) 不同,DPO 不需要拟合奖励模型,并使用更简单的数据(二元偏好)进行训练。 此方法在计算上更轻量、更快,因此在对齐时同样有效,同时效率更高。 在语气、样式或特定内容偏好等主观元素重要的情况下,DPO 特别有用。 我们很高兴宣布从 gpt-4o-2024-08-06 模型开始,在 Azure OpenAI 服务中推出 DPO 公共预览版。

有关微调模型区域可用性的信息,请参阅模型页面

存储的补全和蒸馏

存储的补全使你可以从聊天补全会话中捕获会话历史记录,用作评估微调的数据集。

GPT-4o 2024-11-20

gpt-4o-2024-11-20 现可在以下区域进行全球标准部署

  • 美国东部
  • 美国东部 2
  • 美国中北部
  • 美国中南部
  • 美国西部
  • 美国西部 3
  • 瑞典中部

新的数据区域预配部署类型

数据区域预配部署可在与非全球部署类型相同的 Azure OpenAI 资源中使用,但前者允许利用 Azure 的全球基础结构将流量动态路由到 Microsoft 定义的数据区域中的数据中心,并为每个请求提供最佳可用性。 数据区域预配部署在 Microsoft 指定数据区域中使用 Azure 基础结构为高吞吐量和可预测的吞吐量提供预留模型处理容量。 gpt-4o-2024-08-06gpt-4o-2024-05-13gpt-4o-mini-2024-07-18 模型支持数据区域预配部署。

有关详细信息,请参阅部署类型指南

2024 年 11 月

视觉微调正式发布

具有 GPT-4o (2024-08-06) 的视觉微调现已正式发布。

视觉微调允许向 JSONL 训练数据添加图像。 正如你可以向聊天完成发送一个或多个图像输入一样,你可以在训练数据中包含这些相同的消息类型。 可以将图像作为 URL 或 base64 编码图像提供。

有关微调模型区域可用性的信息,请参阅模型页面

新 AI 滥用监视

我们正在引入新的滥用监视形式,利用 LLM 来提高可能滥用 Azure OpenAI 服务的检测效率,并在无需人工审核提示和补全的情况下启用滥用监视。 要了解详细信息,请参阅滥用监视

通过内容分类标记为和/或标识为潜在滥用使用模式的一部分的提示和补全,将受到额外评审过程的约束,以帮助确认系统分析和通知操作决策。 我们的滥用监视系统已经扩展,默认由 LLM 展开评审,并在必要和适当的情况下由人工进行评审。

2024 年 10 月

新数据区域标准部署类型

数据区域标准部署可在与非全球部署类型相同的 Azure OpenAI 资源中使用,但前者允许利用 Azure 的全球基础结构将流量动态路由到 Microsoft 定义的数据区域中的数据中心,并为每个请求提供最佳可用性。 数据区域标准提供的默认配额高于基于 Azure 地理的部署类型。 gpt-4o-2024-08-06gpt-4o-2024-05-13gpt-4o-mini-2024-07-18 模型支持数据区域标准部署。

有关详细信息,请参阅部署类型指南

全局批处理 GA

Azure OpenAI 全局批处理现已正式发布。

Azure OpenAI Batch API 设计用于高效处理大规模和大容量处理任务。 处理具有单独配额的异步请求组,目标周转时间为 24 小时,成本比全局标准低 50%。 使用批处理,你可以在单个文件中发送大量请求,而不是一次发送一个请求。 全局批处理请求具有单独的入队令牌配额,避免对你的在线工作负载造成任何中断。

关键用例包括:

  • 大规模数据处理:并行快速分析广泛的数据集。

  • 内容生成:创建大量文本,例如产品说明或文章。

  • 文档审查和总结:自动执行对长篇文档的审查和总结。

  • 客户支持自动化:同时处理大量查询,以提高响应速度。

  • 数据提取和分析:从大量非结构化数据中提取和分析信息。

  • 自然语言处理 (NLP) 任务:对大型数据集执行情绪分析或翻译等任务。

  • 营销和个性化:大规模生成个性化内容和建议。

有关详细信息,请参阅开始使用全局批处理部署

o1-preview 和 o1-mini 模型受限访问

o1-previewo1-mini 模型现在可用于 API 访问和模型部署。 需要完成注册,并且会根据 Microsoft 的资格条件授予访问权限

请求访问:受限访问模型应用程序

已经获得批准并可以通过早期访问操场来访问模型的客户无需再次申请,将会自动被授予 API 访问权限。 被授予访问权限后,你需要为每个模型创建部署。

API 支持

API 版本 2024-09-01-preview 中添加了对 o1 系列模型的支持

max_tokens 参数已弃用,并替换为新的 max_completion_tokens 参数。 o1 系列模型仅可使用 max_completion_tokens 参数

区域可用性

这些模型可用于“美国东部 2”和“瑞典中部”的标准和全球标准部署,供批准的客户使用。

适用于语音和音频的新 GPT-4o 实时 API 公共预览版

Azure OpenAI GPT-4o 音频是 GPT-4o 模型系列的一部分,该系列支持低延迟的“语音传入,语音传出”对话交互。 GPT-4o 音频 realtime API 旨在处理实时、低延迟的对话交互,非常适合涉及用户与模型之间的实时交互的用例,例如客户支持代理、语音助理和实时翻译。

gpt-4o-realtime-preview 模型可用于美国东部 2 和瑞典中部地区的全局部署。

有关详细信息,请参阅 GPT-4o 实时音频文档

全局批处理支持更新

全局批处理现在支持 GPT-4o (2024-08-06)。 有关详细信息,请参阅全局批处理入门指南

2024 年 9 月

Azure OpenAI Studio UX 更新

9 月 19 日,当你访问 Azure OpenAI Studio 时,默认情况下你将开始不再看到旧版 Azure AI Foundry 门户。 如果需要,在接下来的几周内,你仍然可以使用 UI 顶部栏中的“切换到旧外观”开关来返回到以前的体验。 如果切换回旧版 Azure AI Foundry 门户,请填写反馈表单告知我们切换的原因,这会对我们很有帮助。 我们会积极监测此反馈,以改善新体验。

GPT-4o 2024-08-06 预配部署

GPT-4o 2024-08-06 现已可用于美国东部、美国东部 2、美国中北部和瑞典中部的配置部署。 它还可用于全局预配部署。

有关模型可用性的最新信息,请参阅模型页面

新的全局预配部署类型

全球部署可在与非全球部署类型相同的 Azure OpenAI 资源中使用,但前者允许利用 Azure 的全球基础结构将流量动态路由到可为每个请求提供最佳可用性的数据中心。 全局预配部署使用 Azure 全局基础结构为高吞吐量和可预测的吞吐量提供预留模型处理容量。 gpt-4o-2024-08-06gpt-4o-mini-2024-07-18 模型支持全局预配部署。

有关详细信息,请参阅部署类型指南

新的 o1-preview 和 o1-mini 模型可供受限访问

Azure OpenAI o1-previewo1-mini 模型设计用于处理推理和问题解决任务,具有更好的针对性和功能。 这些模型将更多时间花费在处理和理解用户的请求上,与以前的更迭版本相比,它们在科学、编码和数学等领域表现得异常强大。

o1 系列的主要功能

  • 复杂代码生成:能够生成算法并处理高级编码任务以支持开发人员。
  • 高级问题解决:非常适合全面的头脑风暴会议和解决多方面的挑战。
  • 复杂文档比较:非常适合分析合同、案例文件或法律文档以识别细微的差别。
  • 指令遵循和工作流管理:对于管理需要较短上下文的工作流特别有效。

模型变体

  • o1-previewo1-previewo1 系列中功能更强大的模型。
  • o1-minio1-minio1 系列中速度更快、价格更便宜的模型。

模型版本:2024-09-12

请求访问:受限访问模型应用程序

限制

o1 系列模型目前以预览版提供,不包含其他模型中的某些功能,例如最新 GPT-4o 模型中提供的图像理解和结构化输出。 对于许多任务而言,正式版 GPT-4o 模型可能仍然更合适。

安全

OpenAI 已在 o1 模型中整合了其他安全措施,包括帮助模型拒绝不安全请求的新技术。 这些进步使得 o1 系列成了当前最可靠的模型之一。

可用性

在美国东部 2 区域,可以通过 Azure AI Foundry 门户抢先体验操场对 o1-previewo1-mini 进行受限访问。 o1 模型的数据处理可能不是在其可供使用的区域中进行。

若要在抢先体验操场中试用 o1-previewo1-mini 模型,需要完成注册,并且会根据 Microsoft 的资格条件授予访问权限

请求访问:受限访问模型应用程序

获得访问权限后,你需要:

  1. 导航到 https://ai.azure.com/resources 并选择 eastus2 区域中的资源。 如果你在此区域没有 Azure OpenAI 资源,则需要创建一个
  2. 选择 eastus2 Azure OpenAI 资源后,在左上面板中的“操场”下,选择“抢先体验操场(预览版)”

2024 年 8 月

GPT-4o 2024-08-06 结构化输出

GPT-4o mini 预配部署

GPT-4o mini 现在可用于加拿大东部、美国东部、美国东部 2、美国中北部和瑞典中部的预配部署。

有关模型可用性的最新信息,请参阅模型页面

GPT-4o 微调(公共预览版)

GPT-4o 微调现在可用于美国中北部和瑞典中部的 Azure OpenAI,以公开预览版方式提供。

有关详细信息,请参阅我们的博客文章

新预览版 API 版本

API 版本 2024-07-01-preview 是最新的 GA 数据平面创作和推理 API 版本。 它替换了 API 版本 2024-05-01-preview 并添加了对以下项的支持:

有关详细信息,请参阅我们的参考文档

GPT-4o mini 区域可用性

  • GPT-4o mini 可用于美国东部和瑞典中部地区的标准和全球标准部署。
  • GPT-4o mini 可用于美国东部、瑞典中部和美国西部区域的全球批量部署。

评估指南

抢先体验操场(预览版)中提供最新的 GPT-4o 模型

2024 年 8 月 6 日,OpenAI 宣布了其旗舰 GPT-4o 模型版本 2024-08-06 的最新版本。 GPT-4o 2024-08-06 具有以前版本的所有功能,以及:

  • 支持复杂结构化输出的增强功能。
  • 最大输出词元数已从 4,096 个增加到 16,384 个。

Azure 客户现可在新的 Azure AI Foundry 抢先体验操场(预览版)中测试 GPT-4o 2024-08-06

与以前的抢先体验操场不同,Azure AI Foundry 门户抢先体验操场(预览版)不需要你在特定区域中拥有资源。

注意

通过抢先体验操场(预览版)给出的提示词和补全可以在任何 Azure OpenAI 区域中进行处理,并且当前受到每个 Azure 订阅每分钟 10 个请求的限制。 此限制将来可能会发生改变。

我们为所有抢先体验操场用户都启用了 Azure OpenAI 服务滥用监视,即使已批准进行修改也是如此;默认内容筛选器已启用,且无法修改。

若要测试 GPT-4o 2024-08-06,请使用此链接登录到 Azure AI 抢先体验操场(预览版)。

全局批处理部署现已推出

Azure OpenAI Batch API 设计用于高效处理大规模和大容量处理任务。 处理具有单独配额的异步请求组,目标周转时间为 24 小时,成本比全局标准低 50%。 使用批处理,你可以在单个文件中发送大量请求,而不是一次发送一个请求。 全局批处理请求具有单独的入队令牌配额,避免对你的在线工作负载造成任何中断。

关键用例包括:

  • 大规模数据处理:并行快速分析广泛的数据集。

  • 内容生成:创建大量文本,例如产品说明或文章。

  • 文档审查和总结:自动执行对长篇文档的审查和总结。

  • 客户支持自动化:同时处理大量查询,以提高响应速度。

  • 数据提取和分析:从大量非结构化数据中提取和分析信息。

  • 自然语言处理 (NLP) 任务:对大型数据集执行情绪分析或翻译等任务。

  • 营销和个性化:大规模生成个性化内容和建议。

有关详细信息,请参阅开始使用全局批处理部署

2024 年 7 月

GPT-4o mini 现在可用于优化

GPT-4o mini 优化功能在瑞典中部和美国中北部现已推出公共预览版

助手文件搜索工具现已计费

助手的文件搜索工具现在具有额外的使用费。 有关详细信息,请参阅定价页

GPT-4o mini 模型可用于部署

GPT-4o mini 是于 2024 年 7 月 18 日首次宣布的最新 Azure OpenAI 模型:

“GPT-4o mini 让客户能够以更低的成本和惊人的速度交付令人惊叹的应用程序。 GPT-4o mini 比 GPT-3.5 Turbo 要智能得多 – 在测量大规模多任务语言理解 (MMLU) 方面,它们的得分为 82% 和 70% – 且成本降低了 60% 以上。该模型提供扩展的 128K 上下文窗口,并集成了改进后的 GPT-4o 多语言功能,为来自世界各地的语言带来更高的质量。”

该模型目前适用于美国东部区域的标准和全球标准部署

有关模型配额的信息,请参阅配额和限制页;有关模型可用性的最新信息,请参阅模型页

新的负责任 AI 默认内容筛选策略

新的默认内容筛选策略 DefaultV2 为 GPT 模型系列(文本)提供了最新的安全与安保缓解措施,其中包括:

  • Prompt Shields 适用于针对用户提示进行的越狱攻击(筛选器),
  • 模型完成时对文本(筛选器)进行的受保护材料检测
  • 模型完成时对代码(批注)进行的受保护材料检测

虽然现有资源和部署的内容筛选器没有变化(默认或自定义内容筛选配置保持不变),但新资源和 GPT 部署会自动继承新内容筛选策略 DefaultV2。 客户可以选择在安全默认值之间进行切换并创建自定义内容筛选配置。

有关详细信息,请参阅我们的默认安全策略文档

新 GA API 版本

API 版本 2024-06-01 是最新的 GA 数据平面推理 API 版本。 它替换了 API 版本 2024-02-01 并添加了对以下项的支持:

  • 嵌入 encoding_formatdimensions 参数。
  • 聊天补全 logprobstop_logprobs 参数。

有关详细信息,请参阅数据平面推理参考文档

gpt-4o 全球标准部署可用区域扩大

GPT-4o 现可在以下区域进行全球标准部署

  • australiaeast
  • 巴西南部
  • canadaeast
  • eastus
  • eastus2
  • francecentral git
  • germanywestcentral
  • 日本东部
  • koreacentral
  • northcentralus
  • norwayeast
  • polandcentral
  • southafricanorth
  • southcentralus
  • southindia
  • 瑞典中部
  • 瑞士北部
  • uksouth
  • westeurope
  • westus
  • westus3

有关全球标准配额的信息,请参阅配额和限制页

2024 年 6 月

停用日期更新

  • 已将 gpt-35-turbo 0301 停用日期更新为不早于 2024 年 10 月 1 日。
  • 已将 gpt-35-turbogpt-35-turbo-16k 0613 停用日期更新为 2024 年 10 月 1 日。
  • 已将 gpt-4gpt-4-32k 0314 弃用日期更新为 2024 年 10 月 1 日,并将相关停用日期更新为 2025 年 6 月 6 日。

有关模型弃用和停用的最新信息,请参阅我们的模型停用指南

用于微调的基于令牌的计费

  • Azure OpenAI 微调计费现在基于训练文件中的令牌数量而非总训练时间。 这可以显著降低一些训练运行的成本,并使估算微调成本变得容易得多。 若要了解详细信息,可以查阅官方公告

GPT-4o 在新区域发布

  • GPT-4o 现已在以下区域推出:
    • 在瑞典中部进行标准区域部署。
    • 澳大利亚东部、加拿大东部、日本东部、韩国中部、瑞典中部、瑞士北部和美国西部 3(预配部署)。

有关模型可用性的最新信息,请参阅模型页面

客户管理的密钥 (CMK) 对助手的支持

助手中的线程和文件现在在以下区域中支持 CMK:

  • 美国西部 3

2024 年 5 月

GPT-4o 预配部署

gpt-4o 版本:2024-05-13 可用于标准部署和预配部署。 预配和标准模型部署同时接受文本和图像/视觉推理请求。 有关模型区域可用性的信息,请参阅预配部署的模型矩阵。

助手 v2(预览版)

更新的助手 API 现已正式发布。 它包含以下更新:

  • 文件搜索工具和矢量存储
  • 用于管理令牌使用情况的最大完成和最大提示令牌支持
  • 用于强制助手使用指定工具的tool_choice 参数。 现在,可以使用助手角色创建消息,以在线程中创建自定义对话历史记录。
  • temperaturetop_presponse_format 参数的支持。
  • 流式处理和轮询支持。 可以使用 Python SDK 中的帮助程序函数来创建运行和流式传输响应。 我们还添加了轮询 SDK 帮助程序来共享对象状态更新,而无需轮询。
  • 使用 Azure OpenAI Studio 试验逻辑应用和函数调用。 将逻辑应用中实现的 REST API 作为函数导入,工作室会根据用户提示自动调用函数(作为逻辑应用工作流)。
  • Microsoft Research 的 AutoGen 提供了一个多代理对话框架,用于跨各种应用程序方便地构建大型语言模型 (LLM) 工作流。 Azure OpenAI 助手现已通过 GPTAssistantAgent 集成到 AutoGen 中,这是一个新的试验性代理,可用于将助手无缝添加到基于 AutoGen 的多代理工作流中。 这使多个 Azure OpenAI 助手(可以是任务或域专用助手)能够协作处理复杂的任务。
  • 在以下区域中支持经过优化的gpt-3.5-turbo-0125 模型
    • 美国东部 2
    • 瑞典中部
  • 扩大对以下模型的区域支持
    • 日本东部
    • 英国南部
    • 美国西部
    • 美国西部 3
    • 挪威东部

有关详细信息,请参阅有关助手的博客文章

GPT-4o 模型正式发布 (GA)

GPT-4o(o 表示“全能”)是 2024 年 5 月 13 日推出的 OpenAI 的最新模型。

  • GPT-4o 在单个模型中集成文本和图像,从而能够同时处理多个数据类型。 这种多模式方法提高了人机交互的准确性和响应能力。
  • GPT-4o 在英语文本和编码任务方面与 GPT-4 Turbo 相当,同时在非英语语言和视觉任务中可提供更优越的性能,为 AI 功能设定了新的基准。

有关模型区域可用性的信息,请参阅模型页面

全球标准部署类型(预览版)

全球部署可在与非全球服务相同的 Azure OpenAI 资源中使用,但可以利用 Azure 的全球基础结构将流量动态路由到可为每个请求提供最佳可用性的数据中心。 全局标准为新模型提供最高的默认配额,并且无需跨多个资源进行负载均衡。

有关详细信息,请参阅部署类型指南

微调更新

DALL-E 和 GPT-4 Turbo Vision GA 可配置内容筛选器

为 DALL-E 2 和 3、支持视觉的 GPT-4 Turbo 正式版 (turbo-2024-04-09) 以及 GPT-4o 部署创建自定义内容筛选器。 内容筛选

适用于所有 Azure OpenAI 客户的异步筛选器

现在,所有 Azure OpenAI 客户都可以异步运行筛选器,以降低流式处理方案中的延迟。 内容筛选

提示盾牌

Prompt Shields 可保护由 Azure OpenAI 模型提供支持的应用程序免受两种类型的攻击:直接(越狱)和间接攻击。 间接攻击(也称为间接提示攻击或跨域提示注入攻击)是针对由生成式 AI 模型提供支持的系统的一种攻击,当应用程序处理并非由应用程序开发者或用户直接创作的信息时,可能会发生这种攻击。 内容筛选

2024-05-01-preview API 版本

GPT-4 Turbo 模型正式发布 (GA)

GPT-4 Turbo 的最新 GA 版本是:

  • gpt-4 版本: turbo-2024-04-09

这是以下预览版模型的替代品:

  • gpt-4 版本: 1106-Preview
  • gpt-4 版本: 0125-Preview
  • gpt-4 版本: vision-preview

OpenAI 与 Azure OpenAI GPT-4 Turbo GA 模型之间的差异

  • OpenAI 的最新 0409 turbo 模型的版本支持所有推理请求的 JSON 模式和函数调用。
  • Azure OpenAI 的最新 turbo-2024-04-09 的版本目前不支持在使用图像(视觉)输入发出推理请求时使用 JSON 模式和函数调用。 基于文本的输入请求(没有 image_url 和内联图像的请求)支持 JSON 模式和函数调用。

与 gpt-4 vision-preview 的差异

  • gpt-4 版本 turbo-2024-04-09 不支持将 Azure AI 特定视觉增强功能与 GPT-4 Turbo with Vision 集成。 这包括光学字符识别 (OCR)、对象接地、视频提示以及改进的图像数据处理。

重要

gpt-4 版本 vision-preview 升级到 turbo-2024-04-09 后,视觉增强预览版功能(包括光学字符识别 (OCR)、对象上下文关联、视频提示)将会停用且不再可供使用。 如果你当前依赖上述任何预览版功能,进行这种自动模型升级将给你的系统造成中断性变更。

GPT-4 Turbo 预配的托管可用性

  • gpt-4 版本: turbo-2024-04-09 可用于标准部署和预配部署。 目前,此模型的预配版本不支持图像/视觉推理请求。 此模型的预配部署仅接受文本输入。 标准模型部署同时接受文本和图像/视觉推理请求。

部署 GPT-4 Turbo with Vision GA

要从 Azure AI Foundry 门户部署 GA 模型,请选择 GPT-4,然后从下拉菜单中选择 turbo-2024-04-09 版本。 gpt-4-turbo-2024-04-09 模型的默认配额将与 GPT-4-Turbo 的当前配额相同。 请参阅区域配额限制

2024 年 4 月

现在,两个新区域(美国东部 2 和瑞士西部)支持微调

现在可以进行微调并支持:

美国东部 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

瑞士西部

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

请查看模型页面,获取有关每个地区模型可用性和微调支持的最新信息。

多轮次聊天训练示例

微调现在支持多轮次聊天训练示例

GPT-4 (0125) 适用于 Azure OpenAI On Your Data

现在可以在可用区域中将 GPT-4 (0125) 模型与 Azure OpenAI On Your Data 配合使用。

2024 年 3 月

Azure OpenAI Studio 中的风险和安全监视

Azure OpenAI Studio 现在为使用内容筛选器配置的每个部署提供风险和安全仪表板。 使用它可检查筛选活动的结果。 然后,可以调整筛选器配置,以更好地满足业务需求并满足负责任 AI 原则。

使用风险和安全监视

基于自有数据的 Azure OpenAI 更新

2024-02-01 正式发布 (GA) API 已发布

这是最新的 GA API 版本,是以前的2023-05-15 GA 版本的替代版本。 此版本增加了对最新 Azure OpenAI GA 功能(例如,Whisper、DALLE-3、微调、数据等)的支持。

仍以预览版提供的功能(例如,助手、文本转语音(TTS)),并且数据数据源上的某些功能仍需要预览版 API 版本。 有关详细信息,请查看 API 版本生命周期指南

Whisper 正式发布 (GA)

Whisper 语音转文本模型现在是 REST 和 Python 的正式发布。 客户端库 SDK 目前仍以公共预览版提供。

按照快速入门试用 Whisper。

DALL-E 3 正式发布 (GA)

DALL-E 3 映像生成模型现已正式发布,适用于 REST 和 Python。 客户端库 SDK 目前仍以公共预览版提供。

按照快速入门试用 DALL-E 3。

对 DALL-E 3 的新区域支持

现在,除了SwedenCentral之外,还可以在East USAustraliaEastAzure 区域中使用 Azure OpenAI 资源访问 DALL-E 3。

模型弃用和停用

我们添加了一个页面用于跟踪 Azure OpenAI 服务中的模型弃用和停用。 此页面提供有关当前可用、已弃用和已停用模型的信息。

2024-03-01-preview API 已发布

2024-03-01-preview 具有与 2024-02-15-preview 相同的功能,并为嵌入添加了两个新参数:

  • encoding_format 允许指定在 floatbase64 中生成嵌入的格式。 默认为 float
  • dimensions 允许设置输出嵌入的数量。 此参数仅在新的第三代嵌入模型中受支持:text-embedding-3-largetext-embedding-3-small。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 调整维度数量的功能让你可以更好地控制总体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions 参数,为了利用此参数,我们建议升级到最新版本:pip install openai --upgrade

如果你当前正在使用预览版 API 来利用最新功能,我们建议参考 API 版本生命周期一文来跟踪当前 API 版本的支持时间。

更新到 GPT-4-1106-Preview 升级计划

原定于 2024 年 3 月 8 日进行的从 gpt-4 1106-Preview 到 gpt-4 0125-Preview 的部署升级将不再发生。 设置为“自动更新为默认版本”和“过期时升级”的 gpt-4 版本 1106-Preview 和 0125-Preview 部署将在模型稳定版本发布后开始升级。

有关升级过程的详细信息,请参阅模型页

2024 年 2 月

GPT-3.5-turbo-0125 模型可用

此模型进行了各种改进,包括提高响应请求格式的准确度,修复导致非英语函数调用的文本编码问题的 bug。

有关模型区域可用性和升级的信息,请参阅模型页面

第三代嵌入模型可用

  • text-embedding-3-large
  • text-embedding-3-small

在测试中,OpenAI 报告显示,大型和小型第三代嵌入模型在 MIRACL 基准中提供了更好的平均多语言检索性能,同时仍在 MTEB 基准中保持了比第二代 text-embedding-ada-002 模型更好的英语任务性能。

有关模型区域可用性和升级的信息,请参阅模型页面

GPT-3.5 Turbo 配额合并

为了简化不同版本的 GPT-3.5-Turbo 模型(包括 16k)之间的迁移,我们将所有 GPT-3.5-Turbo 配额合并为一个配额值。

  • 已批准增加配额的任何客户都将拥有反映之前增加的合并总配额。

  • 任何当前所有模型版本的总使用量低于默认值的客户都将默认获得新的合并总配额。

GPT-4-0125-preview 模型已可用

gpt-4 模型版本 0125-preview 目前在美国东部、美国中北部和美国中南部区域的 Azure OpenAI 服务中可用。 部署了 gpt-4 版本 1106-preview 的客户将在未来几周内自动升级到 0125-preview

有关模型区域可用性和升级的信息,请参阅模型页面

助手 API 公共预览版

Azure OpenAI 现在支持为 OpenAI 的 GPT 提供支持的 API。 使用 Azure OpenAI 助手(预览版),可以通过自定义说明和高级工具(如代码解释器和自定义函数)创建根据需求定制的 AI 助手。 若要了解更多信息,请参阅以下文章:

OpenAI 文本转语音声音公共预览版

Azure OpenAI 服务现在支持使用 OpenAI 声音的文本转语音 API。 从提供的文本中获取 AI 生成的语音。 要了解详细信息,请参阅概述指南并尝试快速入门

注意

Azure AI 语音还支持 OpenAI 文本转语音声音。 要了解详细信息,请参阅通过 Azure OpenAI 服务或通过 Azure AI 语音实现 OpenAI 文本转语音声音指南。

新的微调功能和模型支持

针对基于自有数据的 Azure OpenAI 的新区域支持

现在,可在以下 Azure 区域使用基于自有数据的 Azure OpenAI:

  • 南非北部

基于自有数据的 Azure OpenAI 已正式发布

2023 年12 月

基于自有数据的 Azure OpenAI

  • 对基于自有数据的 Azure OpenAI 的完整 VPN 和专用终结点支持,包括对存储帐户、Azure OpenAI 资源和 Azure AI 搜索服务资源的安全支持。
  • 有关通过使用虚拟网络和专用终结点保护数据来使用基于自有数据的 Azure OpenAI 部署的新文章。

具有视觉的 GPT-4 Turbo 现已推出

Azure OpenAI 服务中具有视觉的 GPT-4 Turbo 现以公共预览版提供。 具有视觉的 GPT-4 Turbo 是 OpenAI 开发的一个大型多模态模型 (LMM),可以分析图像,并为有关图像的问题提供文本回应。 它结合了自然语言处理和视觉理解。 借助增强模式,你可以使用 Azure AI 视觉功能从图像中生成其他见解。

  • 使用 Azure OpenAI 操场在无代码体验中探索 GPT-4 Turbo with Vision 的功能。 在快速入门指南中了解详细信息。
  • 使用 GPT-4 Turbo with Vision 的视觉增强功能现已在 Azure OpenAI 操场中可用,其中包括对光学字符识别和对象接地的支持,对“添加数据”的图像支持,以及对视频提示的支持。
  • 使用 REST API 直接调用聊天 API。
  • 区域可用性目前仅限 SwitzerlandNorthSwedenCentralWestUSAustraliaEast
  • 详细了解具有视觉的 GPT-4 Turbo 的已知局限性和其他常见问题解答

2023 年 11 月

基于自有数据的 Azure OpenAI 中新的数据源支持

已发布 GPT-4 Turbo 预览版和 GPT-3.5-Turbo-1106

两个模型都是 OpenAI 的最新版本,并包含以下改进指令:JSON 模式可重现的输出和并行函数调用。

  • GPT-4 Turbo 预览版具有 128,000 个令牌的最大上下文窗口,可以生成 4,096 个输出令牌。 它拥有截至 2023 年 4 月的最新训练数据和知识。 此模型目前为预览版,不建议用于生产用途。 稳定版本可用后,此预览模型的所有部署将会自动更新。

  • GPT-3.5-Turbo-1106具有 16,385 个令牌的最大上下文窗口,可以生成 4,096 个输出令牌。

有关模型区域可用性的信息,请参阅模型页面

模型具有其唯一的每区域配额分配

DALL-E 3 公共预览版

DALL-E 3 是 OpenAI 的最新映像生成模型。 它在图像中呈现文本时具有增强的图像质量、更复杂的场景和改进的性能。 它还附带了更多纵横比选项。 可通过 OpenAI Studio 和 REST API 使用 DALL-E 3。 OpenAI 资源必须位于 SwedenCentral Azure 区域中。

DALL-E 3 包括内置的提示重写,以增强图像、减少偏差并增加自然变体。

按照快速入门试用 DALL-E 3。

负责任 AI

  • 扩展了客户可配置性:所有 Azure OpenAI 客户现在都可以为仇恨、暴力、性行为和自我伤害等类别配置所有严重性级别(低、中、高),包括仅筛选高严重性内容。 配置内容筛选器

  • 所有 DALL-E 模型中的内容凭据:来自所有 DALL-E 模型的 AI 生成的图像现在都包含一个数字凭据,用于披露内容是由 AI 生成的。 显示图像资产的应用程序可以利用开源的内容真实性计划 SDK 在 AI 生成的图像中显示凭据。 Azure OpenAI 中的内容凭据

  • 新的 RAI 模型

    • 越狱风险检测:越狱攻击是一种用户提示,旨在激发生成式 AI 模型表现出其所训练的行为,以避开或打破系统消息中设置的规则。 越狱风险检测模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在用户提示时运行。
    • 受保护的材料文本:受保护的材料文本将描述可由大型语言模型输出的已知文本内容(例如,歌词、文章、食谱和所选网络内容)。 受保护的材料文本模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在 LLM 完成时运行。
    • 受保护的材料代码:受保护的材料代码将描述与公共存储库中的一组源代码相匹配的源代码,这些源代码可由大型语言模型输出,而无需适当引用源存储库。 受保护的材料代码模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在 LLM 完成时运行。

    配置内容筛选器

  • 阻止列表:客户现在可以通过在其筛选器中创建自定义阻止列表来快速进一步自定义针对提示和完成的内容筛选器行为。 自定义阻止列表允许筛选器对包含各种模式(例如特定术语或正则表达式模式)的自定义列表执行操作。 除了自定义阻止列表,我们还提供了 Microsoft 不雅内容阻止列表(英语)。 使用阻止列表

2023 年 10 月

新的微调模型(预览版)

基于自有数据的 Azure OpenAI

  • 用于确定检索的文档数和严格性的新自定义参数
    • 严格性设置设置将文档分类为与查询相关的阈值。
    • 检索的文档设置指定用于生成响应的数据索引中评分最高的文档数。
  • 可以在 Azure OpenAI Studio 中看到数据引入/上传状态。
  • 支持 Blob 容器的专用终结点和 VPN。

2023 年 9 月

GPT-4

GPT-4 和 GPT-4-32k 现已可供所有 Azure OpenAI 服务客户使用。 客户不再需要申请候补名单即可使用 GPT-4 和 GPT-4-32k(受限访问注册要求仍适用于所有 Azure OpenAI 模型)。 可用性可能因区域而异。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

GPT-3.5 Turbo 指令

Azure OpenAI 服务现在支持 GPT-3.5 Turbo 指令模型。 此模型的性能与 text-davinci-003 相当,并可搭配完成 API 使用。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

耳语公共预览版

Azure OpenAI 服务现在支持由 OpenAI 的耳语模型提供支持的语音转文本 API。 根据你提供的语音音频获取 AI 生成的文本。 若要了解详细信息,请查看快速入门

注意

Azure AI 语音还通过批量听录 API 支持 OpenAI 的耳语模型。 若要了解详细信息,请查看创建批量听录指南。 请查看什么是耳语模型?,详细了解何时使用 Azure AI 语音与 Azure OpenAI 服务。

新区域

  • 现也在瑞典中部和瑞士北部区域推出了 Azure OpenAI。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

区域配额限值提升

  • 某些模型和区域提高到了最大默认配额限值。 通过将工作负载迁移到这些模型和区域,可以利用更高的每分钟令牌数 (TPM)。

2023 年 8 月

基于自有数据的 Azure OpenAI(预览版)更新

2023 年 7 月

支持函数调用

嵌入输入数组增加

新区域

  • Azure OpenAI 现在也在加拿大东部、美国东部 2、日本东部和美国中北部区域中可用。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

2023 年 6 月

使用基于数据的 Azure OpenAI(预览版)

  • 基于自有数据的 Azure OpenAI 现在以预览版提供,你能够与 OpenAI 模型(如 GPT-35-Turbo 和 GPT-4)聊天,并收到根据你的数据做出的响应。

新版本的 gpt-35-turbo 和 gpt-4 型号

  • gpt-35-turbo(版本 0613)
  • gpt-35-turbo-16k(版本 0613)
  • gpt-4(版本 0613)
  • gpt-4-32k(版本 0613)

英国南部

  • Azure OpenAI 现已在英国南部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

配置筛选与注释(预览版)

  • 如何使用 Azure OpenAI 服务配置内容筛选器
  • 启用注释,以在基于 GPT 的补全和聊天补全调用过程中查看内容筛选类别和严重性信息。

Quota

2023 年 5 月

Java 与 JavaScript SDK 支持

  • 新的 Azure OpenAI 预览版 SDK 产品/服务支持 JavaScriptJava

Azure OpenAI 聊天补全正式发布 (GA)

  • 正式发布支持:
    • 聊天补全 API 版本 2023-05-15
    • GPT-35-Turbo 模型。
    • GPT-4 模型系列。

如果当前正在使用 2023-03-15-preview API,建议迁移到 GA 2023-05-15 API。 如果当前使用的是 API 版本 2022-12-01,此 API 仍为正式版,但不包括最新的聊天补全功能。

重要

将当前版本的 GPT-35-Turbo 模型与补全终结点结合使用的功能仍为预览版。

法国中部

  • Azure OpenAI 现已在法国中部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

2023 年 4 月

  • DALL-E 2 公共预览版。 Azure OpenAI 服务现在支持由 OpenAI 的 DALL-E 2 模型提供支持的图像生成 API。 根据你提供的描述性文本获取 AI 生成的图像。 若要了解详细信息,请查看快速入门

  • 自定义模型的非活动部署现在将在 15 天后删除;模型将仍可用于重新部署。 如果自定义(微调)模型是在超过十五 (15) 天前部署的且在此期间未对其进行补全或聊天补全调用,则将自动删除部署(针对该部署,不会产生进一步的托管费用)。 基础自定义模型仍将可用,并且可以随时重新部署。 若要了解详细信息,请查看操作指南文章

2023 年 3 月

  • GPT-4 系列模型现已在 Azure OpenAI 上以预览版提供。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请。 上述模型目前在美国东部和美国中南部区域中可用。

  • 3 月 21 日在预览版中发布了适用于 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API。 要了解详细信息,请查看更新的快速入门操作指南文章

  • GPT-35-Turbo 预览版。 要了解详细信息,请查看操作指南文章

  • 提高了微调的训练限制:对于所有模型,最大训练作业大小(训练文件中的标记数)x(时期数)为 20 亿个标记数。 此外,我们还将最大训练作业时间从 120 小时延长到 720 小时。

  • 将其他用例添加到现有访问权限。 以前,添加新用例的过程要求客户重新应用到服务。 现在,我们将发布一个新流程,允许你快速添加新用例以使用服务。 此过程遵循 Azure AI 服务中既定的受限访问流程。 现有客户可以在此处证明任何和所有新用例。 请注意,每当你想要将服务用于最初未申请的新用例时,都需要这样做。

2023 年 2 月

新增功能

更新

  • 默认启用内容筛选。

以下主题的新文章:

新的培训课程:

2023 年 1 月

新功能

  • 服务 GA。 Azure OpenAI 服务现已正式发布。

  • 新模型 - 添加了最新的文本模型:text-davinci-003(美国东部、西欧)、text-ada-embeddings-002(美国东部、美国中南部、西欧)

2022 年 12 月

新增功能

  • OpenAI 中的最新模型。 Azure OpenAI 提供对所有最新模型(包括 GPT-3.5 系列)的访问权限。

  • 新的 API 版本 (2022-12-01)。 此更新包括几个请求的增强功能,其中包括 API 响应中的令牌使用情况信息、改进的文件错误消息、在微调创建数据结构上与 OpenAI 保持一致,以及对后缀参数的支持以允许微调作业的自定义命名。 ​

  • 每秒请求数的上限更高。 对于非 Davinci 模型,限制为 50。 对于 Davinci 模型,限制为 20。

  • 微调部署速度更快。 在 10 分钟内部署 Ada 和 Curie 微调模型。

  • 训练限制值更高:对于 Ada、Babbage 和 Curie,限制为 4,000 万个训练令牌。 对于 Davinci,限制为 1,000 万。

  • 请求修改滥用和误用数据日志记录和人工评审的过程。 目前,该服务记录请求/响应数据,以便进行滥用和误用检测,确保这些功能强大的模型不会被滥用。 但是,许多客户有严格的数据隐私和安全要求,需要对他们的数据进行更高级别的控制。 为了支持这些用例,我们将发布一个新流程,供客户修改内容筛选策略或关闭低风险用例的滥用日志记录。 此过程遵循 Azure AI 服务中既定的受限访问流程,现有 OpenAI 客户可在此处申请

  • 客户管理的密钥 (CMK) 加密。 CMK 通过提供客户自己的用于存储训练数据和自定义模型的加密密钥,让客户能够更好地控制在 Azure OpenAI 服务中管理其数据。 客户管理的密钥 (CMK)(也称为创建自己的密钥,BYOK)在创建、轮换、禁用和撤销访问控制方面可提供更大的灵活性。 此外,你还可以审核用于保护数据的加密密钥。 有关详细信息,请参阅静态加密文档

  • 密码箱支持

  • SOC-2 符合性

  • 通过 Azure 资源运行状况、成本分析以及指标和诊断设置进行日志记录和诊断

  • 工作室改进。 对工作室工作流进行了大量可用性改进,包括 Azure AD 角色支持,可以控制团队中的哪个成员有权创建微调的模型和部署。

变更(中断性)

微调创建 API 请求已更新,以匹配 OpenAI 的架构。

预览 API 版本:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API version 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

默认情况下,内容筛选暂时处于关闭状态。 Azure 内容审核的工作方式与 Azure OpenAI 不同。 Azure OpenAI 在生成调用期间运行内容筛选器,以检测有害或滥用的内容,并从响应中筛选它们。 了解详细信息​

这些模型将在 2023 年第 1 季度重新启用,并默认开启。 ​

客户操作

后续步骤

详细了解为 Azure OpenAI 提供支持的基础模型