你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
复原能力的共担责任
在 Azure 公有云平台中,复原能力是 Microsoft 和你之间的共担责任。 由于设计和部署的每个工作负载中的复原能力级别不同,因此必须从复原能力的角度了解谁对各个级别负有主要责任。
为了帮助你更好地了解共担责任的工作原理,尤其是在遇到服务中断或灾难时,本文介绍了复原能力的共担责任模型。 要详细了解如何实际使用此模型规划灾难恢复,请参阅“灾难恢复策略的设计建议”。
复原能力的共担责任模型
复原能力的共担责任模型由三个级别组成:
- 核心平台可靠性。 Azure 平台通过底层基础结构、服务和流程为所有客户和所有服务提供基本级别的可靠性。
- 复原能力增强功能 Azure 提供了一套内置功能和服务,可增强复原能力,例如使用可用性区域、跨多个区域部署,以及实施备份策略。 虽然 Azure 提供这些功能,但你有责任评估和配置这些功能,使其符合你的要求。 这些要求可包括可靠性、成本、绩效和法规标准合规性。
- 应用程序。 若要有效使用其他级别,设计应用程序和工作负载时必须考虑复原能力。
Microsoft 独立负责核心平台的可靠性。 Microsoft 还负责提供可以使用的复原能力增强功能。 你负责选择和使用合适的组件。
选择 SaaS、PaaS 还是 IaaS 服务类别决定了你要做出哪种决策。 例如,如果使用 SaaS 服务,通常不需要选择使用可用性区域。 如果将 PaaS 服务用于数据层,则可能可以使用自动备份功能。 如果使用 IaaS 服务,通常需要自行规划和实现许多复原能力功能。
注意
服务类别 (SaaS、PaaS 和 IaaS) 作为广泛的服务分组很有用,但你必须了解你对所使用的每个服务的责任。
可靠性指南从抚养能力的角度概述了每个服务的工作原理,并帮助你做出明智的服务配置决策来满足你的需求。
你还负责应用程序和工作负载设计,并定义可靠性要求,这有助于决定如何设计和配置解决方案。
核心平台可靠性
Microsoft 云平台由大量基础结构、硬件、软件和进程组成,以支持服务部署和管理。 每个组件都设计为具有高复原能力,包含多个硬件冗余,以及基于研究的软件进程。 这些组件共同构成核心平台的可靠性级别。 有关 Microsoft 如何提供可靠平台的一些示例包括:
- 网络具有冗余链接,并且可以动态绕过故障段。
- 在每个区域中,数据中心会通过低延迟网络进行连接,从而实现各种数据复制方法。
- 数据中心设施具有冗余的电源、冷却和网络连接。 他们由保护、监视和管理它们的现场团队运营。
- 硬件(包括群集和机架)在多个层具有冗余。
- 对计算群集、机架和主机的更新遵循受控过程。 我们使用热修补等技术来减少或消除对主机的影响。
- 遵循安全部署做法,应用软件平台更新和配置更改。
- Microsoft 会审核重要的外部供应商,以确保第三方中断不会中断 Azure 服务。
- 每个 Azure 服务都必须有详细的灾难恢复计划。 我们在与生产环境匹配的区域进行全区域向下钻取。
所有 Azure 服务都受益于这些核心平台可靠性功能和 Microsoft 的不断改进。
复原能力增强功能
Azure 提供了许多不同的复原能力增强功能。 尽管 Microsoft 负责提供这些功能,但你完全负责根据需要选择和使用合适的功能。 这些功能的一些示例包括:
区域。 Azure 具有 60 多个区域,可以在单个解决方案中使用多个区域来实现异地冗余,满足数据驻留需求,并在全球范围内向用户启用低延迟通信。
可用性区域。 许多 Azure 区域支持可用性区域,使你能够跨多个独立的数据中心集分发工作负载。 Azure 服务支持可用性区域的方式符合其预期目的,通常通过支持区域部署(固定到单个区域)和/或区域冗余部署(分布在多个区域)。 若要详细了解可用性区域,请参阅“可用性区域是什么?”。
服务层级。 服务提供一系列适合不同要求的套餐和层。 例如,创建虚拟机时,可以在提供低成本选项的标准磁盘和高级磁盘之间进行选择,以实现更高级别的可用性。
备份。 存储数据的许多 Azure 服务都支持备份,这些备份可能是自动备份、手动备份或两者兼有。 使用备份,你可以保护工作负载免受中断以及数据损坏和其他数据丢失事件的影响。
监管。 可以将 Azure Policy、基于角色的访问控制和Microsoft Entra ID 标识保护功能等平台功能配置为一致地强制实施组织的要求。 通过这些方法,你可以保护工作负载免受安全事件和意外更改的侵害,这些更改可能会导致工作负载停机或其他问题。
重要
了解每个 Azure 服务的服务级别协议 (SLA) 非常重要。 SLA 提供有关服务预期运行时间的重要信息,以及需要满足哪些条件才能使用 SLA。 有关每个服务的 SLA,请参阅“联机服务的服务级别协议 (SLA)”。
应用程序
确保应用程序设计为具有复原能力是你的责任。 使用 Azure 架构良好的框架支柱,在工作负载的基本级别推动体系结构卓越。 可靠性支柱侧重于如何使工作负载和应用程序能够复原到不同类型的故障,并在发生故障时启用恢复。
后续步骤
除了复原能力,共担责任模型还适用于解决方案的其他部分。 有关安全共担责任模型的详细信息,请参阅“Microsoft 信任中心”。