业务连续性和灾难恢复

Microsoft 的业务应用程序平台 (BAP) 为 Dynamics 365 和 Power Platform SAAS 应用程序中的所有生产类型环境提供业务连续性和灾难恢复 (BCDR) 功能。 本文描述了 Microsoft 为确保您的生产数据在地区停机期间具有弹性而采取的详细信息和做法。

生产环境的备份

Microsoft 致力于确保您的关键应用程序和数据的最高服务可用性水平。 Microsoft 通过允许地域冗余,将来自生产环境的所有数据(默认环境除外)都备份到配对的次要区域,来确保通过业务连续性和灾难恢复体系结构提供基准基础结构和平台服务。 这些备份称为地理辅助备份,在部署主环境期间设置。

说明数据存储和计算基础结构的地理辅助副本的图表。

上图显示,当主区域 A 在停机期间受到影响时,生产类型环境从区域 A 故障转移到辅助区域 B,这是健康的。 不会对其他类型的环境执行操作,如默认、试用、沙盒、团队或开发人员环境。

要了解非生产环境中的数据保护的详细信息,请参阅备份和还原环境

如何通知您中断事宜?

 主要通信渠道是通过 Microsoft 和 Power platform 管理中心内的服务运行状况仪表板 (SHD)。 Microsoft 通信团队通过发布初始通信来启动此流程,通知您发生中断,并根据需要向 SHD 发布必要的更新。 有关如何在管理中心查看您的消息的更多信息,请参阅主页仪表板。 要更好地做好准备,请访问准备情况页面。    

故障转移和故障恢复流程和业务连续性标准

故障转移和故障恢复是业务连续性和灾难恢复 (BCDR) 过程中完成的两项主要任务,目的是最大限度地减少灾难对关键业务功能和应用程序的可用性和性能的影响。

故障转移是指将主生产站点的所有系统和数据切换到指定的地理辅助备份的过程。 完成故障转移操作后,可通过地理辅助站点来访问生产环境。

重要提示

尽管财务和运营应用在故障转移维护后在次要区域运行,但是包部署、Financial Reporting 和 Power BI 报告不可用。

故障恢复操作是在灾难或计划维护期后将生产恢复到初始状态的过程。

作为 Microsoft 业务连续性和灾难恢复 (BCDR) 标准的一部分,客户可以确保 Microsoft 内的每项在线服务每年都会审查、测试和更新 BCDR 计划。 Microsoft Cloud 业务连续性和灾难恢复计划验证报表在服务信任门户上向客户提供。

如果发生意外的区域性中断,如影响整个 Azure 区域的自然灾害,将执行以下步骤和流程。

Microsoft 的责任 客户责任
如果 Microsoft 检测到中断,发现客户在受影响,Microsoft 的通信团队会发出必要的通信信息,并使服务运行状况仪表板保持最新状态,提供必要的信息。 None
如果客户没有数据丢失,当发生中断时,Microsoft 会自动将生产实例故障转移到次要区域。 None
如果发生中断,Microsoft 确定存在数据丢失,未经客户同意/批准,不会对环境启动故障转移。 如果客户意识到正在发生的中断并看到了影响,那么客户有责任:
- 通过支持部门联系 Microsoft,了解如果启动故障转移,数据丢失的程度。
- 如果数据丢失处于其组织标准可接受的水平,则客户应通过支持部门提供他们的同意,以便 Microsoft 启动故障转移。
当 Microsoft 确定主区域恢复在线并完全正常运行时,将在生产实例上执行故障恢复。 在计划内的故障恢复过程中,不会有数据丢失,但用户可能会在此期间经历短暂的中断或断开。 None

自助灾难恢复(预览版)

[此部分为预发布文档,可能会更改。]

重要提示

  • 这是一项预览功能。
  • 预览功能不适用于生产环境,并且可能具有受限的功能。 这些功能受补充使用条款约束,在正式发布之前已经可用,以便客户可以及早使用并提供反馈。

灾难恢复是一项 Power Platform 高级基础结构功能,允许客户以自助方式在区域之间启动环境故障转移。 客户通常会在其租户中创建多个不同类型的环境。 此功能专门用于生产类型的环境,可以为每个环境开启。 目前,此功能不适用于财务和运营生产环境。

启用自助灾难恢复

您需要先为环境启用自助灾难恢复,然后才能使用该功能。 这是一次性操作,用于预配资源并开始在主位置和辅助位置之间复制数据的过程。 这最多可能需要 48 小时才能完成。 该过程完成后,管理员将收到通知。

在环境中启用灾难恢复对环境或其中的数据没有影响。

若要启用灾难恢复,请完成以下步骤。

  1. 在 Power Platform 管理中心导航到环境列表。
  2. 选择要在其中开启自助式灾难恢复的生产类型环境。
  3. 在页面顶部的命令栏中选择灾难恢复。 此时将显示灾难恢复窗格。
  4. 选择切换,将其更改为启用
  5. 选择保存
  6. 环境会被暂时放在编辑详细信息页面。
  7. 此时将显示环境详细信息页面,指示启用该功能的过程已开始。

有两个原因可能需要您使用此功能:

  • 灾难恢复演练。
  • 发生重大区域性停电时的应急响应。

灾难恢复演练

您的公司可能会将灾难恢复演练记录为内部业务连续性计划中的一项要求。 政府法规可能还要求某些行业和公司对其 BCDR 能力进行审计。 在这些情况下,您可以在环境中运行灾难恢复演练。 灾难恢复演练允许您在不丢失任何数据的情况下执行自助灾难恢复。 当所有剩余数据都复制到次要区域时,故障转移操作的持续时间可能会稍长一些。

我们建议在生产环境的副本上执行演练,因为这会涉及可能持续数分钟的停机时间。 例如,您可能希望将生产环境复制到沙盒类型环境,然后将类型从沙盒更改为生产环境。

紧急响应故障转移

应在紧急情况下选择此选项,即当主要区域持续中断且无法访问环境或数据时。 如果选择此选项,则环境将失败,而不会复制除中断发生前已复制的数据之外的任何其他数据。

执行紧急响应时,将看到以时间表示的数据丢失量,如果您确定可以接受并选择继续,则可以将其与恢复点目标(RPO)进行比较。 环境在运行状态下运行,直到灾难恢复完成,并且环境从次要区域恢复正常运行。

切换回主要区域

在完成演练或缓解中断后,我们建议您将环境切换回其主要区域。 在配对区域中可能使用有限资源运行的环境。 在此操作期间不会丢失数据。

环境灾难恢复状态

管理员可以在环境详细信息页面确定环境的当前灾难恢复状态和位置。 管理员还可以在命令栏中选择灾难恢复,将灾难恢复窗格打开。

如需随时查看数据复制延迟,可以选择灾难恢复,然后选择紧急响应作为灾难恢复原因。 这将打开一个确认对话框,其中包括该环境的区域之间的上次复制时间。 如果您的唯一目的是检查发生故障转移操作时可能丢失的数据,可以选择取消。 请记住,上次同步时间在不同时间总是不同的,因为数据是连续复制的。

记录业务连续性计划

如果您愿意,我们建议您在真正的灾难发生之前执行灾难恢复演练或紧急响应,以便您可以记录 Power Platform 外部任何集成点所需的所有步骤。 在这种情况下,如果发生真正的灾难,您的公司会为恢复做好更充分的准备。

关于预览版的注意事项

在预览期间,此功能不收取任何费用,并且客户无法将其关闭。 当该功能正式发布时,预览客户有机会保留该功能或允许由 Microsoft 关闭它。 如果您选择在正式发布期间不升级,则不会对主要环境位置或功能产生影响。