描述 Azure Site Recovery

已完成

Contoso 必须采用业务连续性和灾难恢复策略,该策略能保护数据,即使在发生计划内停机以及意外中断时,也能让应用和工作负荷保持联机状态。 对于 Contoso 而言,使用 Azure Site Recovery 有助于保持业务应用和工作负荷在停机期间的正常运行,从而确保业务连续性。

Azure Site Recovery 可将物理服务器和 VM 上运行的工作负荷从主站点复制到辅助位置。 如果在 Contoso 主站点发生中断,工作负荷会故障转移到辅助位置,并且用户可从此处访问应用。 在主位置恢复运行后,管理员可将工作负荷故障回复到主位置。

Azure Site Recovery 可以为以下计算机管理复制:

  • 在 Azure 区域之间进行复制的 Azure VM。
  • 本地 VM、Azure Stack VM 和物理服务器。

什么是 Azure Site Recovery?

通过使用 Azure Site Recovery,可以在 Azure 区域之间复制 VM。 还可以使用 Azure Site Recovery 将本地 VM 和物理服务器从本地基础结构迁移到 Azure。 假设 Contoso 的纽约办公室发生了中断,可能是因为洪水。 使用 Azure Site Recovery,可以通过执行到 Azure 的故障转移来减轻此类中断带来的影响。

这是 Azure Site Recovery 中的站点恢复功能,可用于管理未来的中断。 Azure Site Recovery 旨在将工作负荷从指定的主站点或区域复制到所选的辅助站点或区域。 在下图中,主要区域为“美国东部”,次要区域是“美国中部”。

示意图:美国东部区域的站点出现中断,并故障转移到美国中部区域的站点。

Azure Site Recovery 管理以下形式的复制:

  • 在区域间复制 Azure VM。
  • 将本地 VM 复制到 Azure,再将其复制回本地。

提示

由于 Azure Site Recovery 是 Azure 的内置组件,因此它可以运行无缝测试(即“灾难恢复演练”),不会影响生产工作负荷。 也就是说,你可以验证灾难恢复计划能否在需要时生效。

Azure Site Recovery 提供下表所述的功能。

功能 描述
Azure 虚拟机保护 使用 Azure Site Recovery,可以自动保护 Azure 中的 VM。 Azure Site Recovery 将源 VM 配置反映至辅助 Azure 区域,并创建所有需要的或关联的资源组、存储帐户、VNet 和可用性集。 Azure Site Recovery 创建的资源会追加 Azure Site Recovery 后缀。
快照和恢复点 Azure Site Recovery 具有可自定义的复制策略。 这些策略允许你定义恢复点的保留历史记录和快照的频率。 可以从 VM 磁盘的快照创建恢复点。 有两种可用的快照类型:“故障一致”和“应用一致”。 “故障一致”恢复将恢复捕获快照时磁盘上的数据。 “应用一致”恢复与故障一致捕获相同数据,但还包括所有内存中数据和进程内事务。 通过包括内存中数据,Azure Site Recovery 可以还原 VM 和任何运行中的应用,且不会丢失任何数据。 所有恢复点默认保留 24 小时,但可以将此期限延长到 72 小时。
复制到次要区域 为 Azure VM 启用复制时,会安装 Azure Site Recovery 移动服务。 该扩展将 VM 注册到 Azure Site Recovery。 然后开始连续复制 VM,对磁盘的任何写操作都立即转移到本地存储帐户。 Azure Site Recovery 使用此帐户,将缓存复制到目标环境中的存储帐户。 Azure Site Recovery 复制存储在缓存中的数据,并将其与目标存储帐户或复制的托管磁盘同步。 处理数据后,会创建故障一致恢复点。 如果启用了应用一致恢复点,将按照 Azure Site Recovery 复制策略中设置的计划生成它们。
灾难恢复 (DR) 演练 通过使用 Azure Site Recovery,可以在完成所有必需的配置任务后执行灾难恢复演练。 通过运行演练,可以在不丢失数据、不出现停机且不破坏生产环境的情况下验证环境的复制策略。
灵活的故障转移和故障回复 可以通过使用 Azure 门户快速开始 Azure Site Recovery 故障转移和故障回复。 运行故障转移时,由你选择恢复点,然后由 Azure Site Recovery 管理故障转移。 故障回复只是此过程的反向操作。 成功完成故障转移后,可进行故障回复。

使用 Azure Site Recovery 进行故障转移和故障回复

Azure Site Recovery 使你的组织能够灵活选择手动故障转移到辅助 Azure 区域或故障回复到源 VM。 管理此过程的最简单方法是在 Azure 门户中手动操作。

当决定为我们的组织执行 DR 计划时,就会发生故障转移。 受 Azure Site Recovery 保护的现有生产环境将切换至其他区域。 目标环境成为生产环境,会在其中运行组织的生产服务。

注意

目标区域处于活动状态后,就不应再使用源环境。 通过让源 VM 保持关机来强制实现这一点。

关闭源 VM 还有另一个好处。 使用已关机的 VM 可将数据丢失降至最低,因为 Azure Site Recovery 将等待所有数据写入磁盘,再触发故障转移。

什么是重新保护,为什么它很重要?

VM 进行故障转移时,将不再发生 Azure Site Recovery 执行的复制;相反,必须重新启用保护才能开始保护故障转移后的 VM。 由于你已经拥有位于其他区域的基础架构,因此可以开始复制回源区域。 重新保护使 Azure Site Recovery 可以开始将新的目标环境复制回其一开始所在的源环境。

重新保护已故障转移的基础结构时,可灵活选择故障转移单个 VM 或使用恢复计划进行故障转移。 可以单独重新保护每个 VM,也可以使用恢复计划重新保护多个 VM。

注意

重新保护最多需要两小时的时间,具体取决于 VM 的大小和类型。 不同于可通过监视进度来进行监视的其他 Site Recovery 进程,你必须在 VM 级别监视重新保护的情况。

什么是故障回复?

故障回复是反向的故障转移。 指已完成到次要区域的故障转移且该区域现在变为了生产环境的情况。 已完成对已故障转移环境的重新保护,源环境现在变为了其副本。

注意

在故障回复方案中,Azure Site Recovery 会故障转移回源 VM。

故障转移类型

Site Recovery 提供不同的故障转移选项:

  • 测试故障转移。 使用此选项可以运行验证 BCDR 策略的演练,而不会丢失任何数据,也不会出现停机。 它在 Azure 中创建 VM 的副本,这不会对进行中的复制或生产环境造成任何影响:若要验证 BCDR 策略:
    1. 针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。
    2. 选择用于测试故障转移的恢复点。
    3. 选择一个 Azure 网络,故障转移后创建的 Azure VM 将放入该网络。 该网络仅用于测试故障转移。
    4. 验证故障转移测试是否按预期方式进行。 测试完成后,Site Recovery 将自动清理演练期间在 Azure 中创建的 VM。
  • 计划内故障转移 - Hyper-V。 通常用于计划内维护,在计划内的故障转移 - Hyper-V 策略中,源 VM 将关闭,并且会在启动故障转移之前同步最新数据。 计划内故障转移会产生一定的停机时间,但在计划内故障转移期间不会丢失数据。
    1. 规划停机维护时段并通知用户。
    2. 使面向用户的应用脱机。
    3. 使用最新的恢复点启动计划内故障转移。 (如果计算机未关闭或遇到错误,故障转移将不会运行。)
    4. 故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。
    5. 提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。
  • 故障转移 - Hyper-V。 如果发生意外中断或主站点不可用,通常会运行此故障转移选项。 或者可以在启动故障转移之前关闭 VM 并同步最终更改。 使用此方法,可以尽可能地减少应用数据丢失。
    1. 启动 BCDR 计划。
    2. 启动故障转移。 在触发故障转移之前,指定 Site Recovery 是否应关闭 VM 并同步/复制最新的更改。
    3. 可以故障转移到许多恢复点选项:
      • 如果未启用关闭 VM 的选项,或者 Site Recovery 无法关闭 VM,则会使用最新的恢复点。
      • 即使无法关闭计算机,也会运行故障转移。
    4. 故障转移后,验证副本 Azure VM 是否在 Azure 中处于活动状态。 如果需要,可以从 24 小时保留时段中选择不同的恢复点。
    5. 提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。
  • 故障转移 - VMware。 如果发生意外中断或主站点不可用,通常会运行此故障转移选项。 或者可以指定 Site Recovery 应在启动故障转移之前尝试触发 VM 关闭操作,并同步和复制最终更改。 使用此方法,可以尽可能地减少应用数据丢失。
    1. 启动 BCDR 计划。
    2. 从 Site Recovery 启动故障转移:
      • 指定在运行故障转移之前,Site Recovery 是否应尝试触发 VM 关闭并进行同步。 (即使无法关闭计算机,也会运行故障转移。)
    3. 故障转移后,验证副本 Azure VM 是否在 Azure 中处于活动状态。
      • 若有必要,可以从 72 小时保留时段中选择不同的恢复点。
    4. 提交故障转移以完成操作。 提交操作将删除所有恢复点。 对于 Windows VM,Site Recovery 在故障转移期间会禁用 VMware 工具。