你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
关于本地灾难恢复故障转移/故障回复 - 新版
本文概述在将本地计算机灾难恢复到 Azure 期间如何使用 Azure Site Recovery(新版)进行故障转移和故障回复。
有关 Azure Site Recovery 经典版中故障转移和故障回复的信息,请参阅本文。
恢复阶段
Site Recovery 中的故障转移和故障回复分为四个阶段:
- 第 1 阶段:从本地故障转移:设置将本地计算机复制到 Azure 后,当本地站点发生故障时,这些计算机将故障转移到 Azure。 故障转移后,将会基于复制的数据创建 Azure VM。
- 第 2 阶段:重新保护 Azure VM:在 Azure 中重新保护 Azure VM,使之开始复制回到本地站点。 重新保护期间,为帮助确保数据一致性,本地 VM(如果可用)将会关闭。
- 第 3 阶段:从 Azure 故障转移:如果本地站点再次恢复运行正常,则运行另一次故障转移,这一次是将 Azure VM 故障回复到本地站点。 可以故障回复到从中进行故障转移的原始位置,或故障回复到备用位置。 此活动称为“计划的故障转移”。
- 第 4 阶段:重新保护本地计算机:故障回复后,再次启用本地计算机到 Azure 的复制。
故障转移
根据业务连续性和灾难恢复 (BCDR) 策略执行故障转移。
- BCDR 策略的第一步是持续将本地计算机复制到 Azure。 用户访问本地源计算机上运行的工作负荷和应用。
- 如果有需要(例如,如果本地发生服务中断),可将复制计算机故障转移到 Azure。 使用复制的数据创建 Azure VM。
- 为实现业务连续性,用户可以继续访问 Azure VM 上的应用。
故障转移是由两个阶段组成的活动:
- 故障转移:使用所选恢复点创建并启动 Azure VM 的故障转移。
- 提交:故障转移后,验证 Azure 中的 VM:
- 然后,可将故障转移提交到所选的恢复点,或者为提交选择另一个恢复点。
- 提交故障转移后无法更改恢复点。
注意
在 Windows Server 2012 或更低版本上使用崩溃一致性恢复点,因为对于这些版本,在使用应用程序一致性恢复点的情况下,故障转移后的 VM 的启动时间可能会更长。
故障转移后连接到 Azure
若要使用 RDP/SSH 连接到故障转移后创建的 Azure VM,需要满足多个要求。
故障转移 | 位置 | 操作 |
---|---|---|
运行 Windows 的 Azure VM | 故障转移之前在本地计算机上 | 通过 Internet 访问:启用 RDP。 确保已针对“公共”添加了 TCP 和 UDP 规则,并确保在“Windows 防火墙”>“允许的应用”中针对所有配置文件允许 RDP 。 通过站点到站点 VPN 访问:在计算机上启用 RDP。 检查是否在“Windows 防火墙”->“允许的应用和功能”中针对“域和专用”网络允许 RDP。 确保操作系统 SAN 策略已设置为 OnlineAll。 了解详细信息。 在触发故障转移时,请确保 VM 上没有处于挂起状态的 Windows 更新。 Windows 更新可能会在故障转移时启动,在更新完成之前,你将无法登录到 VM。 |
运行 Windows 的 Azure VM | 故障转移之后在 Azure VM 上 | 为 VM 添加公共 IP 地址。 已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则必须允许与 RDP 端口建立传入连接。 选中“启动诊断”可查看 VM 的屏幕截图 。 如果无法连接,请检查 VM 是否正在运行,并查看故障排除提示。 |
运行 Linux 的 Azure VM | 故障转移之前在本地计算机上 | 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。 确保防火墙规则允许 SSH 连接。 |
运行 Linux 的 Azure VM | 故障转移之后在 Azure VM 上 | 已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 SSH 端口建立传入连接。 为 VM 添加公共 IP 地址。 选中“启动诊断”可查看 VM 的屏幕截图 。 |
故障转移类型
Site Recovery 提供不同的故障转移选项。
故障转移 | 详细信息 | 恢复 | Workflow |
---|---|---|---|
测试故障转移 | 用于运行演练,以在不丢失任何数据或造成停机的情况下验证 BCDR 策略。 | 在 Azure 中创建 VM 的副本,这不会对进行中的复制或生产环境造成任何影响。 | 1.针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。 2.选择用于测试故障转移的恢复点。 3.选择一个 Azure 网络,故障转移后创建的 Azure VM 将放入该网络。 该网络仅用于测试故障转移。 4.验证演练是否按预期方式进行。 Site Recovery 将自动清理演练期间在 Azure 中创建的 VM。 |
计划内故障转移 - Hyper-V | 用于计划内停机。 源 VM 已关闭。 在启动故障转移之前,将同步最新的数据。 |
计划的工作流不会发生任何数据丢失。 | 1.规划停机维护时段并通知用户。 2.使面向用户的应用脱机。 3.使用最新的恢复点启动计划内故障转移。 如果计算机未关闭或遇到错误,则故障转移不会运行。 4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 |
故障转移 - Hyper-V | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)在触发故障转移之前关闭 VM 并同步最终更改。 |
应用只会出现极少量的数据丢失。 | 1.启动 BCDR 计划。 2.启动故障转移。 指定在触发故障转移之前 Site Recovery 应关闭 VM 并同步/复制最新的更改。 3.可以故障转移到许多恢复点选项,此处将这些选项进行了汇总。 如果未启用关闭 VM 的选项,或者 Site Recovery 无法关闭 VM,则会使用最新的恢复点。 即使无法关闭计算机,也会运行故障转移。 4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 如果需要,可以从 24 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。 |
故障转移 - VMware | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)指定在启动故障转移之前,Site Recovery 应尝试触发 VM 关闭,并同步和复制最终的更改。 |
应用只会出现极少量的数据丢失。 | 1.启动 BCDR 计划。 2.从 Site Recovery 启动故障转移。 指定在运行故障转移之前,Site Recovery 是否应尝试触发 VM 关闭并进行同步。 即使无法关闭计算机,也会运行故障转移。 3.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 若有必要,可以从 72 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 对于 Windows VM,Site Recovery 在故障转移期间会禁用 VMware 工具。 |
计划内故障转移 - VMware | 你可以执行从 Azure 到本地的计划内故障转移。 | 由于它是计划的故障转移活动,因此在触发计划的故障转移作业后会生成恢复点。 | 触发计划的故障转移时,挂起的更改将复制到本地,而系统会生成 VM 的最新恢复点并关闭 Azure VM。 按照此处讨论的故障转移过程操作。 在此之后,本地计算机将启动。 成功完成计划的故障转移后,计算机将在本地环境中处于活动状态。 |
故障转移处理
在某些情况下,故障转移需要大约 8 到 10 分钟的时间完成其他进程。 对于以下情况,你可能会发现测试故障转移会持续较长时间:
- VMware VM 未启用 DHCP 服务。
- VMware VM 不包含以下启动驱动程序:storvsc、vmbus、storflt、intelide、atapi。
恢复点选项
在故障转移期间,可以选择许多恢复点选项。
选项 | 详细信息 |
---|---|
最新(最低 RPO) | 此选项提供最低的恢复点目标 (RPO)。 它会首先处理已发送到 Site Recovery 服务的所有数据,为每个 VM 创建恢复点,然后将其故障转移到该恢复点。 它最初尝试处理并应用发送到目标位置中的 Site Recovery 服务的所有数据,并使用处理的数据创建恢复点。 但是,如果在触发故障转移时,没有上传到 Site Recovery 服务等待处理的数据,Azure Site Recovery 将不会执行任何处理,因此不会创建新的恢复点。 在这种情况下,它将只使用以前处理过的恢复点进行故障转移。 |
最新处理 | 此选项将 VM 故障转移到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。 |
最新应用一致性 | 如果已启用应用一致性恢复点,此选项会将 VM 故障转移到 Site Recovery 处理的最新应用程序一致性恢复点。 在 VM 设置中检查最新的恢复点。 |
最新处理的多 VM | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的常用多 VM 一致恢复点。 计划中的任何其他 VM 都将故障转移到最新的已处理恢复点。 |
最新的多 VM 应用一致性 | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 故障转移到最新的常用多 VM 应用程序一致恢复点。 其他 VM 故障转移到其最新的应用程序一致恢复点。 |
自定义 | 使用此选项可将指定 VM 及时故障转移到特定的恢复点。 此选项不适用于恢复计划。 |
注意
恢复点无法迁移到另一个恢复服务保管库。
重新保护/计划的故障转移
故障转移到 Azure 后,复制的 Azure VM 处于不受保护状态。
- 故障回复到本地站点的第一步是开始将 Azure VM 复制到本地。 重新保护过程取决于故障转移的计算机的类型。
- 将计算机从 Azure 复制到本地后,可以运行从 Azure 故障转移到本地站点的过程。
- 计算机再次在本地运行后,可以启用复制,以便将其复制到 Azure 进行灾难恢复。
- 在重新保护操作期间,只有从本地复制到 Azure 的磁盘才会从 Azure 复制回来。 新添加到故障转移的 Azure VM 的磁盘不会复制到本地计算机。
- 最多可将 60 个磁盘附加到一个主目标服务器。 如果要故障回复的 VM 包含的磁盘总共超过 60 个,或者要故障回复大量的流量,请创建独立的设备用于故障回复。
计划故障转移的工作方式如下:
- 若要将故障回复到本地,VM 至少需要一个恢复点才能进行故障回复。 恢复计划中的所有 VM 至少需有一个恢复点。
- 由于这是计划的故障转移活动,因此可以选择要将故障回复到的恢复点类型。 建议使用崩溃一致点。
- 还有一个应用一致恢复点选项。 在这种情况下,单个 VM 将恢复到其最新可用的应用一致性恢复点。 对于包含复制组的恢复计划,每个复制组将恢复到其公共的可用恢复点。
- 应用一致性恢复点在时间上可能会落后,并且可能会发生数据丢失。
- 从 Azure 故障转移到本地站点期间,Site Recovery 将关闭 Azure VM。 提交故障转移时,Site Recovery 将删除 Azure 中已故障回复的 Azure VM。
注意
使用崩溃一致性恢复点时,故障转移 VM 启动在 Windows Server 2012 或更高版本上可能需要更长的时间。
VMware/物理机重新保护/故障回复
若要重新保护 VMware 计算机和物理服务器,以及将它们的故障从 Azure 回复到本地,请确保设备正常运行。
设备选择
- 你可以选择在保管库注册的任何 Azure Site Recovery 复制设备,以重新保护到本地。 不需要在 Azure 中单独使用进程服务器执行重新保护操作,也不需要为 Linux VM 提供横向扩展主目标服务器。
- 与转接保护相比,在故障回复期间,复制设备无需另一个网络连接/端口。 如果设备运行状态正常,则同一设备可用于向前和向后保护。 它不应影响复制的性能。
- 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。 设备应始终可以访问源计算机的数据存储。 即使计算机和设备位于不同的 ESX 服务器中,只要数据存储在它们之间共享,重新保护也会成功。
注意
- 不支持复制项的存储 vMotion。 在重新保护操作后,不支持复制设备的存储 vMotion。
- 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。
重新保护作业
- 如果这是一个新的重新保护操作,默认情况下,目标区域的 Azure Site Recovery 会自动创建日志存储帐户。 无需保留磁盘。
- 在备用位置恢复和原始位置恢复中,检索源计算机的原始配置。
注意
- 在重新保护备用位置 (ALR) 或原始位置 (OLR) 的情况下,无法保留静态 IP 地址。
- fstab、LVMconf 将发生更改。
失败
- 可以重试任何失败的重新保护作业。 重试期间,你可以选择任何正常运行的复制设备。
将 Azure 计算机重新保护到本地时,系统会通知你故障回到原始位置或备用位置。
原始位置恢复:这会从 Azure 故障回复到同一台源本地计算机(如果存在)。 在这种情况下,只会将更改复制回到本地。
- OLR 期间选择数据存储:会自动选择附加到源计算机的数据存储区。
备用位置恢复:如果本地计算机不存在,可以从 Azure 故障回复到备用位置。 在本地重新保护 Azure VM 时,将创建本地计算机。 将发生从 Azure 到本地的完整数据复制。 查看位置故障回复的要求和限制。
- ALR 期间选择数据存储:可以选择由保存设备且可供设备访问的 vCenter(读取和写入权限)管理的任何数据存储权限(原始/新)。 你可以选择用于重新保护的缓存存储帐户。
故障转移完成后,Azure VM 中的移动代理会自动注册到 Site Recovery 服务。 如果注册失败,将在已执行故障转移的 VM 上引发严重健康状况问题。 解决问题后,系统会自动触发注册。 解决错误后,你可以手动完成注册。
取消故障转移
如果本地环境未准备就绪,或者你面临着任何挑战,则可以取消故障转移。
在你启动计划的故障转移并成功完成转移后,你的本地环境将可供使用。 但在完成操作后,如果希望故障转移到另一个恢复点,则可取消故障转移。
只能取消计划的故障转移。
你可以从恢复服务保管库中的“复制的项”页取消计划的故障转移。
取消故障转移后,Azure 中的计算机将重新打开,并再次启动从 Azure 到本地的复制。