你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 政府中的 Azure OpenAI 服务和功能

本文重点介绍与商业云产品/服务相比,使用 Azure 政府中的 Azure OpenAI 时的差异。 在 Azure OpenAI 服务文档中,了解有关 Azure OpenAI 服务本身的详细信息。

Azure OpenAI 模型

Azure OpenAI 服务模型中,详细了解每个模型的不同功能。 对于存在业务连续性和灾难恢复 (BCDR) 考量的客户,请务必注意以下部署类型、区域和模型可用性,因为并非所有模型/类型组合都在这两个区域中可用。

以下各节按区域和部署类型显示模型可用性。


标准部署模型可用性

区域 gpt-4o,2024-05-13 gpt-4o-mini,2024-07-18 gpt-41106-Preview gpt-35-turbo0125 gpt-35-turbo1106 text-embedding-3-large1 text-embedding-ada-0022
usgovarizona -
usgovvirginia - -

若要请求增加这些模型的配额,请在 https://aka.ms/AOAIGovQuota 提交请求。 请注意以下将通过该表单授予的最大配额限制:

gpt-4o gpt-4o-mini gpt-4 gpt-35-turbo text-embedding-3-large text-embedding-ada-002
300,000 60 万 200k 500k 70 万 70 万

预配部署模型可用性

区域 gpt-4o,2024-05-13 gpt-4o-mini,2024-07-18 gpt-41106-Preview gpt-35-turbo0125 gpt-35-turbo1106
usgovarizona - - -
usgovvirginia - - -

[注意]

预配吞吐量单位 (PTU) 不同于 Azure OpenAI 中的标准配额,并且在 Azure 政府中默认不可用。 要了解有关此产品/服务的详细信息,请与 Microsoft 帐户团队联系。


Azure OpenAI 功能

在比较 Azure 政府与商业云中的 Azure OpenAI 时,你会发现存在以下功能差异。

Feature 说明
结构化输出 目前尚不支持。
基于预留的购买 目前尚不支持。
批量部署 目前尚不支持。
连接数据 支持虚拟网络和专用链接。 不支持部署到 Web 应用或 Copilot Studio 中的 copilot。
滥用监视 对于 Azure 政府中的 Azure OpenAI,并非启用了所有滥用监视功能。 你负责实施合理的技术和操作措施,以检测和减少任何违反产品条款的服务使用。 默认情况下,自动内容分类和筛选对 Azure 政府保持启用。 如果需要修改的内容筛选器,请在 https://aka.ms/AOAIGovModifyContentFilter 处申请
数据存储 在 Azure 政府中,当前未启用存储客户静态数据的 Azure OpenAI 功能。 但是,仍可在 Azure 政府中启用客户管理的密钥 (CMK),以支持在 Azure 政府和公有云中使用相同的策略。 另请注意,如果将来在 Azure 政府中启用了存储客户数据的 Azure OpenAI 功能,则届时任何现有的 CMK 部署都将应用于该数据。 在“Azure OpenAI 数据隐私”了解详细信息。
合规性 在“Azure 政府服务审核范围”查看 Azure 政府中 Azure OpenAI 合规性的当前状态
服务终结点 openai.azure.us
关键门户
  • Azure OpenAI Studio - aoai.azure.us
  • Azure 门户 - portal.azure.us

Azure 政府中的预配部署

以下指南逐步讲解如何在 Azure 政府中使用 Azure OpenAI 服务资源设置预配部署。

先决条件

  • Azure 政府订阅
  • 一个 Azure OpenAI 资源
  • 预配部署的批准配额和购买的承诺

管理预配吞吐量承诺

对于 Azure 政府中的 Azure OpenAI,预配吞吐量部署需要在 Azure OpenAI Studio 中的“管理承诺”视图创建和管理预购承诺。 可通过从“配额”窗格中选择“管理承诺”来导航到此视图

在“管理套餐”视图中,你可以执行多项操作:

  • 购买新承诺或编辑现有承诺。
  • 监视订阅中的所有承诺。
  • 确定可能导致意外计费的承诺并针对该类承诺采取措施。
设置 说明
选择资源 选择在其中创建预配部署的资源。 购买承诺后,在当前承诺到期前,无法对另一资源使用配额。
选择承诺类型 选择“已预配”。 (“预配”相当于“预配托管”)
当前未承诺的预配配额 当前可供你承诺到此资源的 PTU 数。
承诺量 (PTU) 选择要承诺的 PTU 数。 此数字可以在承诺期内增加,但不能减少。 请以 50 为增量输入承诺类型“预配”对应的值。
当前期间的承诺层级 承诺期设置为一个月。
续订设置 在当前 PTU 自动续订
在较低 PTU 自动续订
请勿自动续订

重要

新的承诺将提前进行整期计费。 如果将续订设置设为自动续订,则会在每个续订日期根据续订设置进行再次计费。

重要

向承诺添加 PTU 时,将立即按照从当前日期到现有承诺期结束的比例金额对其进行计费。 添加 PTU 不会重置承诺期。

更改续订设置

在承诺到期日期之前,可以随时更改承诺续订设置。

重要

如果你允许承诺过期或减小规模,从而使资源下的部署需要比资源承诺中更多的 PDU,则会被收取任何超额 PTU 的每小时超额费用。 例如,如果资源具有总共 500 个 PTU 的部署,但承诺为 300 个 PTU,那么将会有 200 个 PTU 产生每小时超额费用。

常见承诺管理场景

停止使用预配吞吐量

若要终止预配吞吐量的使用,并防止在承诺到期后产生每小时超额费用,必须执行两个步骤:

  1. 将所有承诺的续订策略设置为“不自动续订”
  2. 删除使用配额的预配部署。

将承诺/部署移到同一订阅/区域中的新资源

在 Azure OpenAI Studio 中,无法直接将部署或承诺移动到新资源。 而是需要在目标资源上创建新的部署,并将流量移动到其中。 此过程需要对新资源购买新的承诺。 由于承诺需要预先支付 30 天的费用,因此有必要在原始承诺到期时进行此操作,以尽量减少与新承诺的重叠和重叠期间的“双重计费”。

可通过两种方法来实现此转换。

选项 1:无重叠切换

此选项需要一些停机时间,但不需要额外的配额,也不会产生额外的费用。

步骤 说明
将现有承诺的续订策略设置为到期 此操作可防止续订承诺和产生更多费用
在现有承诺到期之前,删除其部署 停机时间从此时开始,持续到创建新部署并移动流量为止。 可通过在尽可能接近到期日期/时间的时间进行删除来最大限度缩短此持续时间。
在现有承诺到期后,在新资源上创建承诺 在到期后尽快执行此步骤和下一步,以最大限度减少停机时间。
在新资源上创建部署,并将流量移到其中

选项 2:重叠切换

此选项同时运行现有部署和新部署,因此没有停机时间。 此方法还要求具有可用于创建新部署的配额,并且在重叠部署期间产生额外费用。

步骤 说明
将现有承诺的续订策略设置为到期 这样做可防止续订承诺和产生更多费用。
在现有承诺到期之前:
1.在新资源上创建承诺。
2.创建新部署。
3.切换流量
4.删除现有部署
请确保在现有承诺到期之前为所有步骤留出足够的时间,否则可能产生超额费用(请参阅下一节)。