你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
设计区域:Azure 环境的管理
此设计区域为 Azure、混合或多云环境中的运营管理奠定了基础。 在稍后阶段,您可以利用云采用框架中 管理方法 所述的操作指南来增强学习。
设计领域回顾
范围: 本练习的目标是了解运营管理要求,并在云平台中的所有工作负载中一致地实施这些要求。 本练习的主要范围侧重于操作工具。 你将使用运维工具,通过一组常用工具和流程来管理集体工作负载组合。 此初始操作工具集也称为操作基线。
超出范围:可以在所有工作负载中一致地使用本练习中定义的运营基线。 还可以使用其他工具和流程来扩展操作基线,如云采用框架的 管理方法 中所述。 这样做有助于改进特定技术平台或单个工作负荷的操作。
还可以将操作基线与 Azure Well-Architected 框架和 Microsoft Azure Well-Architected 评审配合使用,以改进在云环境中部署的各个工作负荷的操作和体系结构。 但是,任何高级操作、技术平台操作或工作负荷操作都未在此练习的范围内。
设计区域概述
对于云中稳定的持续操作,需要管理基线才能提供可见性、操作合规性以及保护和恢复功能。
管理设计区域侧重于登陆区域设计决策的注意事项和建议。 此外,云采用框架的方法论 为整体管理流程和工具提供了进一步深入的指导。
操作基线
使用以下操作项来评估需要包含在操作基线中的哪些操作管理工具。
范围 | 上下文 |
---|---|
清单和可见性 | 随着云环境的实现和横向扩展,跨越环境的管理控制变得越来越重要。 无论是在降落区上运行的任何服务,都必须管理平台的基础元素,以确保其持续稳定运行。 这些管理工具应根据环境进行扩展。 它们可以包含第一方和第三方工具的组合,取决于您的现有投资。 |
运营合规性 | 修补和管理配置偏移的要求。 自动或集中进行资源优化和大小调整的要求。 应仅由分配的工作负载团队优化或调整大小的工作负载的要求。 确保他们的定期优化工作得以完成的过程。 |
保护和恢复 | 你的组织需要设计适合的平台级功能,应用程序工作负荷可以依赖于基本级别的业务连续性和灾难恢复。 具体而言,这些应用程序工作负荷具有与 恢复时间目标(RTO) 和 恢复点目标(RPO)相关的要求。 请确保捕获灾难恢复 (DR) 要求,以确定并满足高级操作的需求。 |
高级操作
使用以下高级操作项作为云体系结构和运营团队中的讨论点。 这些讨论让您能够探索并就管理设计中需要包含的要求和功能达成共识。
范围 | 上下文 |
---|---|
平台管理 | 评估支持的工作负荷时,这些工作负荷通常依赖于共享平台,例如 SAP、Azure 虚拟桌面、AVS、SQL 等。 当多个工作负荷使用技术平台时,无法将高级操作委托给单个工作负荷团队。 在这些情况下,集中式运营团队需要计划这些共享技术平台的持续运营。 为了履行这些职责,除了支持整个云环境的基础操作之外,还需要额外的工具。 |
工作负荷管理 | 除了为平台服务设置的工具和流程之外,基于登陆区域平台构建的工作负载可能还具有特定的管理要求。 应在平台管理的上下文中考虑这些要求,以确保添加或例外是已知和记录的。 在更广泛的背景下,了解这些要求也很重要。 通常,单个工作负载的某项要求可能会成为一种通用模式。 将这些情况视为整个平台工具集的一部分,以避免不必要的重复工作。 有关特定于工作负载的管理注意事项的详细信息,请参阅 Azure 架构良好的框架的卓越运营。 |