你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure 政府中的 Azure OpenAI 服务和功能
本文重点介绍与商业云产品/服务相比,使用 Azure 政府中的 Azure OpenAI 时的差异。 在 Azure OpenAI 服务文档中,了解有关 Azure OpenAI 服务本身的详细信息。
Azure OpenAI 模型
在 Azure OpenAI 服务模型中,详细了解每个模型的不同功能。 对于存在业务连续性和灾难恢复 (BCDR) 考量的客户,请务必注意以下部署类型、区域和模型可用性,因为并非所有模型/类型组合都在这两个区域中可用。
以下各节按区域和部署类型显示模型可用性。
标准部署模型可用性
区域 | gpt-4o,2024-05-13 | gpt-4o-mini,2024-07-18 | gpt-4,1106-Preview | gpt-35-turbo,0125 | gpt-35-turbo,1106 | text-embedding-3-large,1 | text-embedding-ada-002,2 |
---|---|---|---|---|---|---|---|
usgovarizona | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ |
usgovvirginia | ✅ | - | ✅ | ✅ | ✅ | - | ✅ |
若要请求增加这些模型的配额,请在 https://aka.ms/AOAIGovQuota 提交请求。 请注意以下将通过该表单授予的最大配额限制:
gpt-4o | gpt-4o-mini | gpt-4 | gpt-35-turbo | text-embedding-3-large | text-embedding-ada-002 |
---|---|---|---|---|---|
300,000 | 60 万 | 200k | 500k | 70 万 | 70 万 |
预配部署模型可用性
区域 | gpt-4o,2024-05-13 | gpt-4o-mini,2024-07-18 | gpt-4,1106-Preview | gpt-35-turbo,0125 | gpt-35-turbo,1106 |
---|---|---|---|---|---|
usgovarizona | ✅ | - | - | ✅ | - |
usgovvirginia | ✅ | - | - | ✅ | - |
[注意]
预配吞吐量单位 (PTU) 不同于 Azure OpenAI 中的标准配额,并且在 Azure 政府中默认不可用。 要了解有关此产品/服务的详细信息,请与 Microsoft 帐户团队联系。
Azure OpenAI 功能
在比较 Azure 政府与商业云中的 Azure OpenAI 时,你会发现存在以下功能差异。
Feature | 说明 |
---|---|
结构化输出 | 目前尚不支持。 |
基于预留的购买 | 目前尚不支持。 |
批量部署 | 目前尚不支持。 |
连接数据 | 支持虚拟网络和专用链接。 不支持部署到 Web 应用或 Copilot Studio 中的 copilot。 |
滥用监视 | 对于 Azure 政府中的 Azure OpenAI,并非启用了所有滥用监视功能。 你负责实施合理的技术和操作措施,以检测和减少任何违反产品条款的服务使用。 默认情况下,自动内容分类和筛选对 Azure 政府保持启用。 如果需要修改的内容筛选器,请在 https://aka.ms/AOAIGovModifyContentFilter 处申请 |
数据存储 | 在 Azure 政府中,当前未启用存储客户静态数据的 Azure OpenAI 功能。 但是,仍可在 Azure 政府中启用客户管理的密钥 (CMK),以支持在 Azure 政府和公有云中使用相同的策略。 另请注意,如果将来在 Azure 政府中启用了存储客户数据的 Azure OpenAI 功能,则届时任何现有的 CMK 部署都将应用于该数据。 在“Azure OpenAI 数据隐私”了解详细信息。 |
合规性 | 在“Azure 政府服务审核范围”查看 Azure 政府中 Azure OpenAI 合规性的当前状态 |
服务终结点 | openai.azure.us |
关键门户 |
|
Azure 政府中的预配部署
以下指南逐步讲解如何在 Azure 政府中使用 Azure OpenAI 服务资源设置预配部署。
先决条件
- Azure 政府订阅
- 一个 Azure OpenAI 资源
- 预配部署的批准配额和购买的承诺
管理预配吞吐量承诺
对于 Azure 政府中的 Azure OpenAI,预配吞吐量部署需要在 Azure OpenAI Studio 中的“管理承诺”视图创建和管理预购承诺。 可通过从“配额”窗格中选择“管理承诺”来导航到此视图。
在“管理套餐”视图中,你可以执行多项操作:
- 购买新承诺或编辑现有承诺。
- 监视订阅中的所有承诺。
- 确定可能导致意外计费的承诺并针对该类承诺采取措施。
设置 | 说明 |
---|---|
选择资源 | 选择在其中创建预配部署的资源。 购买承诺后,在当前承诺到期前,无法对另一资源使用配额。 |
选择承诺类型 | 选择“已预配”。 (“预配”相当于“预配托管”) |
当前未承诺的预配配额 | 当前可供你承诺到此资源的 PTU 数。 |
承诺量 (PTU) | 选择要承诺的 PTU 数。 此数字可以在承诺期内增加,但不能减少。 请以 50 为增量输入承诺类型“预配”对应的值。 |
当前期间的承诺层级 | 承诺期设置为一个月。 |
续订设置 | 在当前 PTU 自动续订 在较低 PTU 自动续订 请勿自动续订 |
重要
新的承诺将提前进行整期计费。 如果将续订设置设为自动续订,则会在每个续订日期根据续订设置进行再次计费。
重要
向承诺添加 PTU 时,将立即按照从当前日期到现有承诺期结束的比例金额对其进行计费。 添加 PTU 不会重置承诺期。
更改续订设置
在承诺到期日期之前,可以随时更改承诺续订设置。
重要
如果你允许承诺过期或减小规模,从而使资源下的部署需要比资源承诺中更多的 PDU,则会被收取任何超额 PTU 的每小时超额费用。 例如,如果资源具有总共 500 个 PTU 的部署,但承诺为 300 个 PTU,那么将会有 200 个 PTU 产生每小时超额费用。
常见承诺管理场景
停止使用预配吞吐量
若要终止预配吞吐量的使用,并防止在承诺到期后产生每小时超额费用,必须执行两个步骤:
- 将所有承诺的续订策略设置为“不自动续订”。
- 删除使用配额的预配部署。
将承诺/部署移到同一订阅/区域中的新资源
在 Azure OpenAI Studio 中,无法直接将部署或承诺移动到新资源。 而是需要在目标资源上创建新的部署,并将流量移动到其中。 此过程需要对新资源购买新的承诺。 由于承诺需要预先支付 30 天的费用,因此有必要在原始承诺到期时进行此操作,以尽量减少与新承诺的重叠和重叠期间的“双重计费”。
可通过两种方法来实现此转换。
选项 1:无重叠切换
此选项需要一些停机时间,但不需要额外的配额,也不会产生额外的费用。
步骤 | 说明 |
---|---|
将现有承诺的续订策略设置为到期 | 此操作可防止续订承诺和产生更多费用 |
在现有承诺到期之前,删除其部署 | 停机时间从此时开始,持续到创建新部署并移动流量为止。 可通过在尽可能接近到期日期/时间的时间进行删除来最大限度缩短此持续时间。 |
在现有承诺到期后,在新资源上创建承诺 | 在到期后尽快执行此步骤和下一步,以最大限度减少停机时间。 |
在新资源上创建部署,并将流量移到其中 |
选项 2:重叠切换
此选项同时运行现有部署和新部署,因此没有停机时间。 此方法还要求具有可用于创建新部署的配额,并且在重叠部署期间产生额外费用。
步骤 | 说明 |
---|---|
将现有承诺的续订策略设置为到期 | 这样做可防止续订承诺和产生更多费用。 |
在现有承诺到期之前: 1.在新资源上创建承诺。 2.创建新部署。 3.切换流量 4.删除现有部署 |
请确保在现有承诺到期之前为所有步骤留出足够的时间,否则可能产生超额费用(请参阅下一节)。 |