你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
入门:通过适当的控制提高可靠性
如何应用适当的控制来提高可靠性? 本文可帮助你最大程度地减少与以下方面相关的中断:
- 配置中的不一致情况。
- 资源组织。
- 安全基线。
- 资源保护。
本文中的步骤可帮助运营团队平衡整个 IT 解决方案组合的可靠性和成本。 本文还可帮助治理团队确保以一致方式应用平衡措施。 可靠性还取决于其他角色和功能。 本文将映射支持功能,以帮助你在相关团队之间保持一致。
在企业可靠性方面,运营管理和治理是平等的合作伙伴。 在运营做法方面做出的决策规定了可靠性基线。 用于治理整体环境的方法确保所有资源的一致性。
本文中的前两个步骤可帮助这两个团队入门。 这两个步骤按顺序列出,但可以同时执行。 后续步骤可帮助整个企业开启共同旅程,直至在整个企业中部署更可靠的解决方案。
步骤 1:建立运营管理要求
创建的所有工作负载并非都是相同的。 在任何环境中,有些工作负载会对业务产生直接且持续的影响。 还有一些支持性的业务流程和工作负载对整体业务产生的影响较轻。 在此步骤中,云运营团队确定并实施初始要求以支持整个 IT 解决方案组合。
交付成果:
- 实施管理基线,以定义所有生产工作负载所需的标准运营。
- 与云战略团队协商业务承诺,以制定高级运营和复原要求方面的计划。
- 如果大多数工作负载需要额外的运营,请扩大管理基线。
- 将高级运营要求应用于支持最关键工作负载的登陆区域和资源。
- 在运营管理工作簿中记录整个 IT 项目组合的运营决策。
关于支持实现交付成果的指导:
管理基线:
- 清单和可见性: 云原生工具 可帮助你收集数据和配置警报,帮助你实现 最适合操作模型的监视平台 。
- 运营合规性:大部分中断往往起因于资源配置的更改或不合理的维护做法。 遵循 Azure 服务器管理指南实施云原生工具,以管理资源配置的修补和更改。
- 保护和恢复:任何平台都不可避免地会发生中断。 发生中断时,请准备好使用备份和恢复解决方案,以最大程度地减少中断持续时间。
高级运营:使用管理基线作为业务协调沟通的基础。 此基线可帮助你明确地讨论关键性、业务影响和运营承诺。 业务协调有助于量化和验证对增强基线的请求、特定技术平台的管理,或工作负载特定的运营。
指导体系结构评审:可能需要根据运营要求在工作负载级别进行体系结构更改。 Microsoft Azure 架构良好的框架和 Microsoft Azure 架构良好的评审可以帮助指导与特定工作负载的技术所有者的对话。
问责团队 | 负责和支持团队 |
---|---|
步骤 2:以一致的方式应用管理基线
企业可靠性要求以一致的方式应用管理基线。 这种一致性源自适当的企业策略、IT 流程和自动化工具。 这些资源主导了所有受影响资源的管理基线的实施。
交付:
确保对所有受影响的系统正确应用管理基线。
关于支持实现交付成果的指导:
- 确保所有工作负载和资源遵循正确的命名和标记约定。 使用 Azure Policy 强制实施标记约定,并特别强调关键性标记。
- 如果你还不熟悉云治理,请使用治理方法建立治理策略、流程和规程。
- 如果你不熟悉成本管理规程,请遵循成本管理规程改进一文中的指导。 请重点阅读实施部分。
注意
与其他团队开始建立可靠合作关系的步骤:在整个云采用生命周期中做出的各项决策都可能直接影响可靠性。 以下步骤概述了在整个 IT 解决方案组合中提供一致可靠性所需的合作关系和支持工作。
问责团队 | 负责和支持团队 |
---|---|
步骤 3:定义战略
战略决策直接影响可靠性。 它们贯穿了整个采用生命周期,并渗入到了长期运营。 明确的战略可以改善可靠性工作。
交付成果:
- 在战略和计划模板中记录动机、结果和业务理由。
- 确保管理基线提供符合云采用战略方向的运营支持。
关于支持实现交付成果的指导:
- 了解动机:关键业务事件和某些迁移动机往往对成本敏感。 对于以后的所有工作,这些方面可以凸显成本控制的重要性。 与通过迁移实现创新或增长相关的其他前瞻性动机可能更多地关注顶行收入。 了解动机有助于确定成本管理的优先级。
- 业务成果:一些会计成果往往对成本极为敏感。 当期望的成果映射到财务指标时,请尽早投入时间制定成本管理治理规程。
- 业务理由:业务理由可以充当云采用总体财务计划的概要视图。 进行最初的预算工作时,可以参阅它。
问责团队 | 负责和支持团队 |
---|---|
步骤 4:制定云采用计划
数字资产(或对现有 IT 解决方案组合的分析)可帮助你验证业务理由。 它可以提供整个 IT 解决方案组合的具体化视图。 采用计划澄清了采用期间的活动时间表。
根据数字资产分析结果协调采用计划时,可以规划将来的运营管理依赖项。 了解采用计划后,还可以邀请云运营团队参与开发周期。 他们可以评估和规划对提供工作负载运营所需的管理基线的任何更改。
交付成果:
更新战略和计划模板,以反映实现目标战略所需的更改。 记录的更改可能包括:
- 对现有数字资产的评估。
- 反映所需更改和所涉及工作的云采用计划。
- 实施计划所需的组织更改。
- 一个用于解决现有团队成功完成所需工作所需的技能问题的计划。
与治理团队合作,以协调成本模型和预测模型。 此流程包括通过量化分析开始优化支出的工作。
关于支持实现交付成果的指导:
- 收集库存:建立数据源,以便在采用之前对数字资产进行分析。
- 最佳做法:Azure Migrate:使用 Azure Migrate 收集库存。
- 增量合理化:在增量合理化过程中,量化分析可以识别用于预算目的的云候选项。
- 调整成本模型和预测模型:使用Microsoft成本管理通过 创建预算来协调成本和预测模型。
- 制定云采用计划:制定一项包含可操作工作负载、资产和时间表详细信息的计划。
问责团队 | 负责和支持团队 |
---|---|
步骤 5:实施登陆区域最佳做法
云采用框架的就绪方法主要侧重于开发登陆区域以在云中托管工作负载。 在登陆区域实施过程中,有多项决策可能会影响运营。 要帮助审查登陆区域以改进运营,请咨询云运营团队。 另外,请咨询云治理团队以了解可能影响登陆区域设计的资源一致性策略和设计指导。
交付成果:
- 在短期采用计划中部署一个或多个可以托管工作负载的登陆区域。
- 确保所有登陆区域满足运营决策和资源一致性要求。
关于支持实现交付成果的指导:
- 改善登陆区域运营:有关改善登陆区域中运营的最佳做法。
问责团队 | 负责和支持团队 |
---|---|
步骤 6:完成采用工作和变更阶段
在迁移和创新过程中做出的决策可能会影响长期运营。 在采用过程的早期保持一致的协调有助于消除对生产发布造成的阻碍。 这样还能减少将新解决方案引入运营管理做法所需的工作量。
交付成果:
- 使用资源一致性策略测试生产部署的运营就绪状态。
- 验证对资源一致性设计指导和运营要求的遵守情况。
- 在操作管理工作簿中记录任何高级操作要求。
关于支持实现交付成果的指导:
问责团队 | 负责和支持团队 |
---|---|
价值声明
这些步骤可帮助实施所需的控制和流程来确保整个企业和所有托管资源的可靠性。