使用 Azure Site Recovery 进行故障转移和故障回复

已完成

Azure Site Recovery 使你的组织能够灵活选择手动故障转移到次要 Azure 区域或故障恢复到源 VM。 管理此过程的最简单方法是在 Azure 门户上手动操作。 如果你的公司想要自动触发故障转移,可以使用其他选项启用自动化。 这些选项包括多种技术,例如通过 PowerShell 执行脚本,或在 Azure 自动化中设置 runbook 来协调故障转移。

按照这些步骤操作,将受保护的 VM 完全故障转移到订阅中的次要区域。 故障转移成功完成后,要对 VM 进行故障回复。

在此单元中,你将了解故障转移和故障回复,还将了解如何重新保护已故障转移的 VM 以及监视重新保护的状态。

什么是故障转移?

此图显示了不可用的源区域以及正在故障转移到的新目标环境。

当决定为组织执行 DR 计划时,就会发生故障转移。 受 Site Recovery 保护的现有生产环境将复制到其他区域。 目标环境成为实际的生产环境,并成为在其中运行组织的生产服务的环境。 目标区域处于活动状态后,就不应再使用源环境。 需通过使源 VM 保持关机来强制满足此条件。

关闭源 VM 还有另一个好处。 使用已关机的 VM 可将数据丢失降至最低,因为 Site Recovery 将等待所有数据写入磁盘,再触发故障转移。 为使用此数据并具有尽可能低的 RPO,我们选择“最新(最低 RPO)”恢复点。

显示故障转移选项的屏幕截图。

什么是重新保护,为什么它很重要?

VM 完成故障转移后,Site Recovery 执行的复制将不再处于活动状态。 必须重新启用保护才能开始保护已进行故障转移的 VM。 由于你已经拥有位于其他区域的基础架构,因此可以开始复制回源区域。 重新保护使 Site Recovery 可以开始将新的目标环境复制回其一开始所在的源环境。

重新保护已进行故障转移的基础结构时,选择比较灵活,可对单个 VM 进行故障转移,也可使用恢复计划进行故障转移。 可以单独重新保护每个 VM,也可以使用恢复计划重新保护多个 VM。

重新保护需要 45 分钟到 2 小时的时间,具体取决于 VM 的大小和类型。 不同于通过监视作业进度来监视其他 Site Recovery 进程,你必须在 VM 级别查看重新保护的进度。 有这种要求,是因为同步阶段未列为站点恢复作业。

此图显示了受保护项的状态,并突出显示了已同步的百分比。

此屏幕截图显示了名为 patient-records 的 VM 的状态,并突出显示了已同步的百分比。

什么是故障回复?

故障回复是反向的故障转移。 也就是说,已完成到次要区域的故障转移,该区域现在变为了生产环境。 已完成对已故障转移环境的重新保护,源环境现在变为了其副本。 在故障回复方案中,Site Recovery 会故障转移回源 VM。

完成故障回复的过程与故障转移相同,甚至可以重复使用恢复计划。 在恢复计划中选择故障转移将“自”设置为目标区域,将“到”设置为源区域。

管理故障转移

Site Recovery 可以按需运行故障转移。 测试故障转移是隔离的,这意味着它们不会影响生产服务。 这种灵活性使我们能够在不妨碍该系统用户的情况下运行故障转移。 灵活性还体现在,支持在计划测试或完全调用 DR 过程中按需进行故障回复。

Site Recovery 中的恢复计划还允许对故障转移和故障回复进行自定义和排序。 这些计划允许你对计算机和工作负荷进行分组。

还可以灵活选择触发故障转移过程的方式。 可通过 Azure 门户轻松完成手动故障转移。 也可以选择通过执行 PowerShell 脚本或使用 Azure 自动化中的 runbook 进行自动化。

解决故障转移问题

即使 Site Recovery 是自动化的,仍然可能出现错误。 下表列出了发现的三个最常见的问题。 有关问题及其故障排除方式的完整列表,请参阅摘要单元中的链接。

Azure 资源配额问题

Site Recover 必须在不同区域中创建资源。 如果你的订阅不允许执行此操作,复制将会失败。 如果订阅的配额限制有误而无法创建与源 VM 大小匹配的 VM,也会发生此错误。

若要更正此错误,请联系 Azure 计费支持人员,并请求他们在所需的目标区域中创建正确大小的 VM。

可以保护一个或多个磁盘

如果已为 VM 设置 Site Recovery, 随后添加或初始化了其他磁盘,则会发生此错误。

若要修复此错误,可以为新添加的磁盘添加复制,也可以选择忽略磁盘警告。

受信任的根证书

检查是否已安装最新的根证书,以允许 Site Recovery 与 VM 通信并对其进行身份验证,以便安全复制。 如果未向 VM 应用最新更新,则会看到此错误。 必须先更新 Windows 和 Linux VM,Site Recovery 才能启用复制。

对于每种操作系统,更正方式是不同的。 Windows 非常简单,只需确保已打开自动 Windows 更新,并且应用了更新。 对于每个 Linux 分发版,需要按照分销商提供的指南进行操作。