用于云规模分析的业务连续性和灾难恢复

项目
2025-01-24

为云服务设计体系结构时，请考虑可用性要求以及如何响应服务中的潜在中断。问题可能本地化为特定实例或区域范围。为两者制定计划是非常重要的。根据恢复时间目标和恢复点目标，可以选择高可用性和灾难恢复的激进策略。

高可用性和灾难恢复有时可以组合在一起。这两个方面的策略略有不同，尤其是在数据方面。若要了解有关详细信息，请参阅 Microsoft Azure 架构良好的框架及其可靠性原则。

与其试图避免故障，不如接受故障是有可能且会发生的。最大程度地减少生命周期中任何单个失败组件的影响。对成本、恢复点目标和恢复时间目标的容忍度决定了要实现的解决方案类型。

备份策略

许多替代策略可用于跨区域实现分布式计算。策略必须针对应用程序的业务要求和环境进行定制。概括而言，这些方法分为以下类别：

备份和还原： 从灾难发生前的最后一个备份副本还原数据库应用程序。此方法通常用于在数据损坏或意外删除之后。
灾难时重新部署： 灾难发生时从头开始重新部署应用程序。此方法适用于不需要有保证的恢复时间的非关键应用程序。
热备用（主动/被动）：在备用区域创建辅助托管服务。部署角色以保证最小容量。这些角色不会接收生产流量。此方法对于未设计为跨区域分配流量的应用程序非常有用。
热备份（主动/主动）：设计应用程序以接收多个区域的生产负载。可以将每个区域中的云服务配置为容量高于灾难恢复目的所需的容量。相反，可以在灾难或故障转移时根据需要扩展云服务。

此方法需要对应用程序设计进行投资，但有好处。它提供低且有保证的恢复时间。无需持续测试所有恢复位置和容量的有效使用率。对于数据库应用程序，此方法包括两个与单个连接点同步的数据库的负载均衡器。

Azure 服务的灾难恢复和高可用性

云规模分析由多个 Azure 服务组成，这些服务分为平台、核心和数据。有关特定于服务的可靠性指南和灾难恢复的详细信息，请参阅 Azure 可靠性文档

后续步骤

数据管理概述