你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
在迁移后优化成本
将工作负荷迁移到 Azure 后,应优化成本,以确保不会超支。 本文提供有关如何在迁移后优化成本的指导,以及如何在业务中断最少的情况下解除停用的资产。
针对成本优化迁移的工作负荷
迁移工作负载并解除不需要的资源后,可以根据工作负荷的实时数据优化工作负荷,从而节省成本。
可以根据工作负荷在评估期间的性能调整工作负荷的大小,但你可能会发现,在 Azure 中运行工作负荷时,可以节省额外的成本。
用于优化成本的工具
迁移到 Azure 后,可以使用新的工具来管理资源成本。 使用以下列表来帮助管理云支出。
工具 | 说明 | 资源 |
---|---|---|
Rightsize 资产 | 查看服务使用情况指标并对其进行权限化以满足工作负荷要求。 | |
Azure 虚拟机预留实例 | 预留实例允许你提交到经常运行的 Azure 中的资源。 考虑为始终处于活动状态的工作负荷保留实例。 | |
Azure 节省计划 | 与即用即付定价相比,Azure 储蓄计划提供高达 65% 的节省,当你承诺在计算服务上花费固定的每小时一到三年。 | |
成本管理 | 可以使用 Microsoft 成本管理来监视和管理环境的成本。 | |
财务运营文档 | 财务运营是一项规则,将财务管理原则与云工程和运营相结合,以便组织更好地了解其云支出。 |
解除已停用资产的授权
将迁移的工作负荷提升到生产环境后,不再需要运行工作负荷的资产,并被视为服务外。 但这些资产仍然消耗电力和其他资源,从而增加成本。 因此,关闭和处置退休资产以减少开支是个好主意。
关闭和处置旧资产和设备似乎很简单,但可能发生意外的问题。 下面是有关如何安全关闭和处置旧资源的一些提示,而不会给企业带来任何问题。
继续监视
将迁移的工作负荷提升到生产环境后,应继续监视计划停用的资产,以确保正确路由生产流量。
虽然资产可能已关闭,但它们仍可能利用存储、网络和其他基础结构资源。 如果他们被重新打开,则除非他们已被删除,否则可能会导致意外问题。
监视资源的以下信号:
- 计算:资源计算使用情况,例如 CPU 和 RAM。
- 存储:资源存储使用情况,如磁盘输入/输出(I/O)。
- 网络:包括来自设备的入站和出站网络的资源网络使用情况。 例如,检查使用防火墙和负载均衡器进行通信的资产。
- 日志:Windows 和应用程序日志。
- 其他信号:在以前生产环境中托管资产时用于监视资产的任何其他信号。
在某些迁移中,资产不会关闭。 相反,它们是重复的。 突然高峰甚至并发帐篷模式使用基础结构信号以及网络活动或新日志可以指示资产仍在使用中。
测试窗口和依赖项验证
即使进行最佳规划,生产工作负荷仍可能包含假定停用的资产的依赖项。 在这种情况下,关闭已停用的资产可能会导致意外的系统故障。 因此,请处理与系统维护活动相同的任何资产的终止。
建立适当的测试和中断时段,以便终止资源。 需要维护时段才能在终止之前成功测试资产。 选择一段时间可以测试资产,而不会造成任何业务中断。
定义测试和维护时段
- 低影响时间:确定测试窗口的低影响时间。 选择应用程序使用的最低时间。
- 清除测试用例:确定可在测试窗口中执行的明确测试用例,该测试用例与应用程序用户执行的实际活动相匹配。 这些活动不应为图面级别,而是应映射所使用的每个进程。 如果有测试用例,则可以重复使用迁移中的测试用例。 如果你有经常在应用程序中工作的用户或其他团队成员,请尝试让他们执行测试。
- 计划并传达:只要你可用,就计划维护时段。 你应该瞄准至少四个小时。
- 计划:规划窗口,以便应用程序用户可以提前计划。 两周是合理的。
- 沟通:提前宣布更改。 设置在此维护时段内可能存在中断的预期,并且系统可能无法响应。 用户不应期望应用程序在此期间可用。
维护时段之前
- 执行测试用例:运行测试用例并监视资源的任何使用情况。
- 如果发现使用情况,则不应继续维护时段。 相反,应该进一步调查,看看资产是否仍在使用中。
- 如果未发现使用情况,可以继续维护时段。
在维护时段内
- 禁用资产:禁用标记为停用的资产。
- 如果资产仍处于开机状态,则关闭资产。
- 从任何负载均衡器中删除资产,并确认它们无法响应传入的请求。
- 执行测试:针对 Azure 中运行的工作负荷执行测试用例。
- 测试成功且未失败:目前未使用资产。
- 传达更改窗口的末尾,以便用户知道他们可以再次期望应用程序中的稳定性。
- 测试成功后继续下一部分。
- 测试失败:资产目前可能正在使用,并且需要执行更多测试。
- 重新启用标记为解除授权的资产,并重复失败的测试用例。
- 如果测试用例继续失败,则可能存在不相关的问题。 需要在维护时段内测试更多内容,还应开始升级以确保你具有适当的支持级别。
- 如果测试用例停止失败,则问题可能相关。 完成测试后,应使资产保持启用状态并关闭维护时段。
- 调查计划维护时段外的问题。 计划另一个维护时段以更改已迁移的工作负荷,并计划额外的维护时段进行测试。
- 测试成功且未失败:目前未使用资产。
保留期和数据验证
完成测试窗口后,标记为解除授权的所有资产都应关闭并断开连接,以便可以操作工作负荷。 可以继续执行下一阶段的退役,但不立即处置资产。
考虑持有期
在迁移的复制过程中丢失数据,这种情况并不罕见。 对于不定期访问的较旧数据尤其如此。 暂时保留已停用的资产,以充当数据的临时备份。 在处置已停用的资产之前,应至少允许保留和测试 30 天。
考虑数据管理要求
组织的数据治理团队可能具有超过 30 天保留期的更多要求。
- 了解保留期义务:应与必要的团队检查,以了解保留信息的义务,并为特定法律要求构建验证检查列表。
- 目前资产操作并不重要。 相反,应检索有关信息的数据。 根据需要保留磁盘或备份以还原数据。
- 例如,如果物理数据中心有 SQL 数据库服务器,则可以备份其数据并将其作为可恢复的资源进行维护。 然后,可以解除虚拟机的授权,并设置一个保留时间来停用备份。
下一步
停用停用的资产后,迁移已完成。 这创造了一个很好的机会,通过回顾来改进迁移过程,以学习和改进。