你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在迁移后优化成本

将工作负荷迁移到 Azure 后,应优化成本,以确保不会超支。 本文提供有关如何在迁移后优化成本的指导,以及如何在业务中断最少的情况下解除停用的资产。

优化已迁移的工作负载以降低成本

迁移工作负载并解除不需要的资源后,可以根据工作负荷的实时数据优化工作负荷,从而节省成本。

可以根据工作负荷在评估期间的性能调整工作负荷的大小,但你可能会发现,在 Azure 中运行工作负荷时,可以节省额外的成本。

用于优化成本的工具

迁移到 Azure 后,可以使用新的工具来管理资源成本。 使用以下列表来帮助管理云支出。

工具 描述 资源
将资产调整至适当大小 查看服务使用情况指标并对其进行权限化以满足工作负荷要求。
  • Azure 顾问成本建议
  • Azure 虚拟机预留实例 通过预留实例,可预定在 Azure 中频繁运行的资源。 请考虑为始终处于活动状态的工作负载预留实例。
  • 管理 Azure 资源的预留
  • Azure 虚拟机(VM)大小调整,以实现最大预留使用量
  • Azure 节省计划 如果你承诺一年或三年在计算服务上每小时支出固定金额,Azure 节省计划与即用即付定价相比可提供高达 65% 的节约。
  • Azure 节省计划建议
  • 成本管理 可以使用Microsoft成本管理来监视和管理环境的成本。
  • 成本管理
  • 顾问中的预留建议
  • FinOps 框架 FinOps 是一项规则,将财务管理原则与云工程和运营相结合,为组织提供对云支出的更好地了解。
  • 什么是 FinOps?
  • 解除已停用资产的授权

    将迁移的工作负荷提升到生产环境后,用于运行该工作负荷的资产不再需要,并被视为停用。 但这些资产仍然消耗电力和其他资源,从而增加成本。 因此,关闭和处置退休资产以减少开支是个好主意。

    关闭和处置旧资产和设备似乎很简单,但可能发生意外的问题。 下面是有关如何安全关闭和处置旧资源的一些提示,而不会给企业带来任何问题。

    继续监视

    将已迁移的工作负载提升到生产环境后,应继续监视计划停用的资产,确保正确路由生产流量。

    虽然资产可能已关闭,但它们仍可能利用存储、网络和其他基础结构资源。 如果它们被重新启用,除非已被移除,否则可能会导致意外问题。

    监视资源的以下信号:

    • 计算:资源计算使用情况,例如 CPU 和 RAM。
    • 存储:资源存储使用情况,如磁盘输入/输出(I/O)。
    • 网络:资源网络使用情况,包括来自设备的入站和出站网络。 例如,检查使用防火墙和负载均衡器进行通信的资产。
    • 日志:Windows 和应用程序日志。
    • 其他信号:在以前的生产环境中托管资产时用于监视资产的任何其他信号。

    在某些迁移中,资产不会被关闭。 相反,它们会被复制。 突然出现的峰值或持续适中使用基础设施信号,以及网络活动或新增日志,可能表明该资产仍在使用中。

    测试窗口和依赖项验证

    即使进行最佳规划,生产工作负荷仍可能包含假定停用的资产的依赖项。 在这种情况下,关闭已停用的资产可能会导致意外的系统故障。 因此,请像对待系统维护活动一样,谨慎处理任何资产的终止。

    建立适当的测试窗口期和停机窗口期,以便关闭资源。 需要维护时段才能在终止之前成功测试你的资产。 选择一段时间可以测试资产,而不会造成任何业务中断。

    定义测试和维护时段

    • 低影响时间:确定测试时段的低影响时间。 选择应用程序使用的最低时间。
    • 清除测试用例:确定可在测试窗口中执行的明确测试用例,这些测试用例与应用程序用户执行的实际活动相匹配。 这些活动不应停留在表面,而是应详细规划所使用的每个流程。 如果迁移中有测试用例,可以重复使用这些用例。 如果你有经常在应用程序中工作的用户或其他团队成员,请尝试让他们执行测试。
    • 计划并通信:为维护安排一个你有空的时段。 你应该争取至少四个小时。
      • 计划:规划窗口,以便应用程序用户可以提前计划。 两周是合理的。
      • 通信:提前公布更改。 设置在此维护时段期间系统可能会中断并且系统可能无响应的预期情况。 用户不应期望应用程序在此期间可用。
    在维护时段之前
    • 执行测试用例:运行测试用例并监视资源的任何使用情况。
      • 如果发现使用,则不应继续维护时段。 相反,应该进一步调查,看看资产是否仍在使用中。
      • 如果没有发现使用,可继续维护时段。
    在维护时段期间
    • 禁用资产:禁用标记要解除授权的资产。
      • 如果资产仍打开,请将其关闭。
      • 从任何负载均衡器中删除资产,并确认它们无法响应传入的请求。
    • 执行测试:针对 Azure 中运行的工作负荷执行测试用例。
      • 测试成功且没有失败:资产目前未使用。
        • 告知更改窗口结束,让用户知道他们可以再次期望应用程序的稳定性。
        • 测试成功后,继续到下一部分。
      • 测试失败:资产目前可能正在使用,并且需要进行更多测试。
        • 重新启用标记为停用的资产,并重复执行失败的测试用例。
        • 如果测试用例继续失败,则可能存在不相关的问题。 需要在维护时段内测试更多内容,还应开始升级以确保你具有适当的支持级别。
        • 如果测试用例停止失败,则问题可能相关。 完成测试后,应使资产保持启用状态,并关闭维护窗口。
        • 在计划维护时段之外调查问题。 计划另一个维护时段以更改已迁移的工作负荷,并计划额外的维护时段进行测试。

    保留期和数据验证

    测试时段之后,标记要解除授权的所有资产都应关闭并断开连接,以便你可操作工作负载。 您可以进入退役的下一阶段,但不要立即处置资产。

    考虑保留期

    在复制过程中,迁移错过数据的情况并不少见。 对于不定期访问的较旧数据尤其如此。 暂时保留已停用的资产,以充当数据的临时备份。 在处置已停用的资产之前,应至少允许保留和测试 30 天。

    考虑数据管理要求

    组织的数据治理团队可能具有超过 30 天保留期的更多要求。

    • 了解保留期义务:应与必要的团队核实,以了解保留信息的义务,并为具体的法律要求构建验证清单。
      • 目前,让资产运行不重要。 相反,信息上的数据应该是可检索的。 根据需要保留磁盘或备份以还原数据。
      • 例如,如果物理数据中心有 SQL 数据库服务器,则可以备份其数据并将其作为可恢复的资源进行维护。 然后,可以解除虚拟机的授权,并设置一个保留时间来停用备份。

    下一步

    在解除已停用资产的授权后,迁移完成。 这创造了一个很好的机会,通过回顾来改进迁移过程,以学习和改进。