你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

转换到 Azure OpenAI 服务预配的部署预留

Azure 为 Azure OpenAI 服务引入了新的全局和数据区域预配部署预留。 这些新选项提供更大的灵活性和可伸缩性,使你能够访问所需的模型,并缩放预配的吞吐量单位 (PTU),以支持使用量增长。 此外,Microsoft 宣布了新的部署类型较低的每小时价格和较小的部署最小值,尽管每月和每年预留的价格保持不变。

凭借这些改变,Azure 有望更好地服务不断变化的需求。 如果当前使用的是区域预配部署,你可能会发现转换到全局部署或数据区域预配部署具有显著优势。 本指南可帮助你了解转换过程,包括如何迁移应用程序和部署,以及如何转换涵盖部署的任何现有预留。

Azure OpenAI 服务预配部署的更改

  • 2024 年 9 月,Azure 启动了全局预配部署预留。
  • 2024 年 12 月,Azure 启动了数据区域预配部署预留。
  • 尽管大多数客户目前采用区域预配部署,但如果需要,全局和数据区域预配部署可能会更好地满足你的需求:
    • 访问所需的模型。
    • 缩放 PTU 以支持使用量增长。
  • 对于全局和数据区域预配部署,Microsoft 宣布了较低的每小时价格和较小的部署最小值。 该公告的每月和每年预留价格没有变化。
  • 随着全球和数据区域预配部署的启动,Azure 现在提供的服务更能满足不断发展需求。

从区域预配部署转换到全局预配部署或数据区域预配部署

如果要从区域预配部署迁移到全局部署或数据区域部署,则需要迁移服务端的应用程序或部署。 需要转换涵盖这些部署的预留(如有)。

将 Azure OpenAI 服务部署从区域转换到全局区域或数据区域

如果使用现有的 Azure OpenAI 服务区域预配部署,可通过两个选项转换为数据区域或全局预配部署类型:

选项 1 - 无停机

  1. 在所需的 Azure OpenAI 服务资源中使用 Azure OpenAI 服务全局预配或数据区域预配部署类型创建新部署。
  2. 将流量从现有的 Azure OpenAI 服务区域预配部署转换到新创建的 Azure OpenAI 服务全局部署或数据区域预配部署,直到从区域预配部署卸载所有流量。
  3. 删除现有的区域预配部署。

选项 2 – 停机

  1. 确保在 Azure OpenAI 服务区域预配部署上停止所有 Azure OpenAI 服务 API 请求。
  2. 删除现有的区域预配部署。
  3. 在所需的 Azure OpenAI 服务资源中使用 Azure OpenAI 服务全局预配或数据区域预配部署类型创建新部署。

将 Azure OpenAI 服务预配预留从区域转换到全局区域或数据区域

  • 首先,必须决定要在预配区域部署上保留多少个 PTU。 然后决定迁移到预配的全局或数据区域部署的 PTU 数量。
  • 在这些部署中,需要确定需要预留多少才能获得折扣价格。
  • 全球、数据区域和区域部署的预留不可互换。 需要为每个部署类型购买单独的预留。
  • 如果已有区域预配部署,并且想要转换到全局或数据区域预配部署,则两种类型的部署可能需要存在短暂的时间段,才能迁移应用程序。 这样可以正确调整区域预配部署的大小。
  • 根据所需的结束状态(跨区域、数据区域和全局部署),需要取消现有预留,并购买涵盖部署的新预留。
  • 这可能会导致以下两种情况之一:
    • 现有预留和新购买的预留重叠,两者都产生费用。
    • 取消现有预留和购买新预留之间存在时间差,导致部署按小时费率收费(而不是预留价格,因为没有任何预留涵盖这些部署)。
    • 无论哪种情况,它都不被视为双重计费,但从一个部署转换到另一个部署至关重要。
  • 仔细规划部署转换和预留转换,可以尽量减少费用。
    • 转换部署时,请确保预留管理员了解所需的结束状态。 然后,可以取消并购买相应部署类型的正确数量的预留单位。
    • 确保所有部署都具有匹配的预留,从而避免部署产生按小时的费用。
    • 避免提前购买预留,以防止尚未处于活动状态的部署产生费用。
    • 取消不涵盖任何部署的预留。
  • 购买新的全局或数据区域预留以替换或交换现有预留时,将批准取消现有的预配区域预留。

    注意

    在有限的时间内支持取消。 如果要转换到全局或数据区域预留,则应停止预配区域预留的自动续订。

方案 1 - 年度预留

  1. 取消要转换为全局或数据区域的 PTU 数的现有预配区域预留。

  2. 若要涵盖要转换的部署,请购买相应的全局或数据区域预留。

    例如,假设区域部署上有 300 个 PTU。 你决定将 200 个 PTU 转换到数据区域部署,并在区域部署保留其余 100 个。 此外,假设你有一个或多个预留来涵盖所有 300 个现有区域部署。

    1. 若要合并和重新调整预留,需要取消现有的 300 个 PTU 预留。
    2. 若要涵盖 200 个数据区域部署,请购买数据区域预留。
    3. 购买区域预留以涵盖 100 个区域部署。
  3. 如果认为存在错误或额度到期,可以创建支持请求

方案 2 - 每月预留

在此方案中,你拥有两个选项:

选项 1 - 建议用于单月预留

  1. 让当前的每月预留自行过期。 例如,停止自动续订现有预留。

  2. 若要合并和重新调整预留,请购买相应的全局、数据区域或区域预留。 它们涵盖要转换到的部署。

    例如,假设区域部署上有 300 个 PTU。 你决定将 200 个 PTU 转换到数据区域部署,并在区域部署保留其余 100 个。 此外,假设你有单个预留涵盖所有 300 个现有区域部署。

    1. 若要重新调整预留,需要停止自动续订涵盖 300 个 PTU 的现有预留。
    2. 在预留到期的同一天或第二天,购买数据区域预留以涵盖 200 个数据区域部署。 购买区域预留以涵盖 100 个区域部署。
    3. 正确安排购买新预留的时间有助于避免预留重叠或按每小时即用即付费率收费。
  3. 如果认为存在错误或额度到期,可以创建支持请求

选项 2 - 建议用于多月预留

重要信息

警告

如果取消当前的 PTU 预留,但未购买新的全局或数据区域 PTU 预留,则所有 PTU 部署均按每小时价格收费。

如果金额小于或等于 50,000 美元,则可以自行取消预留。 否则,必须联系 Azure 支持部门以请求取消。 若要联系支持部门取消,请参阅创建支持请求

在有限的时间内支持取消。 如果要转换到全局或数据区域预留,则应停止预配区域预留的自动续订。