业务连续性和灾难恢复
备注
全新改进的 Power Platform 管理中心现已进入公开预览阶段! 我们将新的管理中心设计为更易于使用,具有面向任务的导航功能,可帮助你更快地实现特定结果。 随着新的 Power Platform 管理中心进入正式发布阶段,我们将发布新的更新文档。
企业希望其应用程序和客户数据在不可避免的中断和中断期间受到保护并具有弹性。 制定记录在案的业务连续性计划非常重要,该计划旨在将中断的影响降至最低。 确保计划包括利益相关者、流程以及恢复和重新运行的具体步骤。
Microsoft 为 Dynamics 365 和 Power Platform 软件即服务 (SAAS) 应用程序中的所有生产环境提供业务连续性和灾难恢复 (BCDR) 功能。 本文介绍 Microsoft 为确保生产数据在中断期间具有弹性而采取的详细信息和做法。
下图显示了服务于单个或多个国家/地区的地理区域的典型体系结构。 虽然您的 Power Platform 管理员只需关注地理位置,但在地理位置内,Microsoft 会部署更多基础架构,为您的数据提供扩展和额外保护。
一个地域至少包括一个 Azure 区域,该区域通常由三个可用区组成,但不少于两个可用区。
具有 Azure 可用区的内置区域内灾难恢复
Microsoft 认识到网络、电源或冷却等基础设施组件可能会意外发生故障,例如,由于雷击。 这可能会影响一个或多个数据中心。 为确保复原能力,我们构建并部署了可用性区域,在其中,您的环境将至少跨两个不同的区域进行复制。
Microsoft 自动检测可用区级故障,并几乎立即切换到该区域的其他可用区。 这可以保护您免受任何数据丢失的影响,并且通常停机时间接近于零。 此区域内功能适用于生产类型环境,这些环境需要托管业务关键型应用程序流程和数据。 确保您的生产流程和数据未部署在非生产类型(如沙盒、开发人员或试用环境类型)中,从而保护自己免受中断。
为确保无缝灾难恢复,可用区提供内置的复原能力,无需手动干预。 客户数据在至少两个可用区之间同步复制,从而实现零数据丢失。 恢复点目标为零,快速恢复或恢复时间目标小于 5 分钟。 如果一个区域发生故障,流量会自动重新路由到其余区域,同时将服务中断降至最低。
生产环境的备份
与之前针对 Dynamics 365 和 Power Platform 工作负载的备份和故障转移流程相比,向可用性区域的过渡是一项重大改进。 这些工作负载通常需要联系客户支持进行手动干预。 您的数据和服务在主要区域内保持高度可用,并具有跨多个区域的内置实时冗余。
主要改进包括:
- 始终保持弹性:现在,您的环境会在多个可用区之间自动复制,不再需要单独的地理辅助备份。
- 更快的恢复:通过跨区同步复制,区域内的故障切换几乎是瞬时的,从而最大限度地减少了中断和数据丢失。
- 无缝体验:与需要恢复的传统备份不同,可用性区域可使您的环境持续处于活动状态。
- 降低支持依赖性:主区域内的自动故障切换使大多数灾难恢复方案不再需要联系微软支持。
某些地区的少数客户正在过渡到改进的体系结构。 无论该区域已转换还是正在转换中,该服务始终会在多个数据中心保留环境数据备份。
可用区之间的距离足够远,可以降低中断影响多个区域的可能性,但又足够近,可以与其他可用区建立低延迟连接。 可用区之间的距离通常为 60 英里或 100 公里。
在某个地理位置内需要更远距离的客户可以选择使用自助灾难恢复在次要区域中维护副本。 利用该功能,客户可以控制故障切换操作并执行灾难恢复演习,如下节所述。
跨区域自助灾难恢复(预览版)
[此部分为预发布文档,可能会更改。]
重要提示
- 这是一项预览功能。
- 预览功能不适用于生产环境,并且可能具有受限的功能。 这些功能受补充使用条款约束,在正式发布之前已经可用,以便客户可以及早使用并提供反馈。
大多数地理位置通常由区域对组成,最小距离尽可能为 300 英里,以便在大范围灾难中保护数据。
自助式灾难恢复是一种 Power Platform 基础架构功能,允许客户远距离复制环境,并以自助方式启动区域间的环境故障切换。
客户通常会在其租户中创建多个不同类型的环境。 此功能专门针对生产型管理环境,可为每个环境开启。 目前,此功能不适用于财务和运营生产环境。
备注
在预览期间,此功能不收取任何费用,您无法将其关闭。 当该功能正式发布时,预览版客户可以按照本文中列出的成本和计费详细信息保留该功能,或者允许通过 Microsoft 将其关闭。 如果您选择在正式发布期间不升级,则不会对主要环境位置或功能产生影响。
自助灾难恢复成本和计费
激活灾难恢复的环境会在两个区域之间复制所有环境数据,并且可以在两个区域之间进行故障转移。 数据库、日志和文件等不同存储类型的复制数据会添加到 Dataverse 容量消耗中,并按照与主存储相同的费率计费。
要在环境中使用自助式灾难恢复,环境必须首先链接到即用即付计费计划。
如果您的环境已使用即用即付计费计划,则无需进一步作,复制的容量将计入 Azure 订阅。
如果您的环境被配置为从租户的 Dataverse 容量权益中提取容量,那么权益容量将首先被消耗,但您仍然需要即用即付计费计划,这样才能避免容量超额。 了解如何通过即用即付计费计划分配容量和管理容量超额。 了解更多信息,请参阅查看使用和计费信息。
启用自助灾难恢复
按照上述方式设置计费后,可以为环境启用自助灾难恢复。 这是一次性操作,用于预配资源并开始在主位置和辅助位置之间复制数据的过程。 这最多可能需要 48 小时才能完成。 该过程完成后,管理员将收到通知。
在环境中启用灾难恢复对环境或其中的数据没有影响。
若要启用灾难恢复,请完成以下步骤。
- 以系统管理员身份登录 Power Platform 管理中心。
- 在导航窗格中,选择管理。
- 在管理窗格中,选择环境。 显示环境页面。
- 选择要开启自助式灾难恢复的生产型环境。
- 在页面顶部的命令栏中选择灾难恢复。 此时将显示灾难恢复窗格。
- 选择切换,将其更改为启用。
- 选择保存。
- 环境会被暂时放在编辑详细信息页面。
- 此时将显示环境详细信息页面,指示启用该功能的过程已开始。
这两个事件可能需要您使用此功能:
- 灾难恢复演练。
- 发生重大区域性停电时的应急响应。
灾难恢复演练
您的公司可能会将灾难恢复演练记录为内部业务连续性计划中的一项要求。 政府法规可能要求某些行业和公司对其 BCDR 能力进行审核。 在这些情况下,您可以在环境中运行灾难恢复演练。 灾难恢复演练允许您在不丢失任何数据的情况下执行自助灾难恢复。 当所有剩余数据都复制到次要区域时,故障转移作的持续时间可能会稍长。
我们建议对生产环境的副本执行演练,因为这涉及可能持续数分钟的停机时间。 例如,您可能希望将生产环境复制到沙盒类型环境,然后将类型从沙盒更改为生产环境。
紧急响应故障转移
您可以在紧急情况下选择此选项,即当主要区域持续中断并且无法访问环境或数据时。 如果选择此选项,则环境将失败,而不会复制除中断发生前已复制的数据之外的任何其他数据。
执行紧急响应时,将看到以时间表示的数据丢失量,如果您确定可以接受并选择继续,则可以将其与恢复点目标(RPO)进行比较。 环境以 Running 状态运行,直到灾难恢复完成,并且环境从次要区域恢复正常运行。
切换回主要区域
在完成演练或缓解中断后,建议您将环境切换回其主要区域。 在配对区域中,环境可能使用有限的资源运行。 在此操作期间不会丢失数据。
环境灾难恢复状态
管理员可以在环境详细信息页面确定环境的当前灾难恢复状态和位置。 管理员还可以在命令栏中选择灾难恢复,将灾难恢复窗格打开。
如需随时查看数据复制延迟,可以选择灾难恢复,然后选择紧急响应作为灾难恢复原因。 这将打开一个确认对话框,其中包括该环境的区域之间的上次复制时间。 如果您的唯一目的是检查发生故障转移操作时可能丢失的数据,可以选择取消。 请记住,由于数据是连续复制的,因此上次同步时间在不同时间总是不同的。
记录业务连续性计划
如果您愿意,我们建议您在真正的灾难发生之前执行灾难恢复演练或紧急响应,以便您可以记录 Power Platform 外部任何集成点所需的所有步骤。 如果发生真正的灾难,您的公司将为恢复做好更充分的准备。