你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure 数据平台的 DR - 场景详细信息

Azure Synapse Analytics
Azure 机器学习
Azure Cosmos DB
Azure Data Lake
Azure 事件中心

数据服务拓扑

概括而言,Contoso 数据平台的数据服务拓扑可说明如下:Contoso 数据服务拓扑概要示意图。此逻辑图可将 Contoso 数据生态系统的关键功能抽象为简化的高级视图。 此抽象化视图支持涵盖方案部署的各个部分,与灾难恢复 (DR) 策略选择和服务恢复过程中的职责分离相一致。

DR 影响与客户活动

以下各部分介绍对具有不同影响的 DR 事件所需的 Contoso 活动的明细。

区域:基础组件

  • Microsoft Entra ID,包括角色权利

    • Contoso SKU 选择:Premium P1
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • 管理组

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • 订阅

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • Azure Key Vault

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • Azure Monitor

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • Microsoft Defender for Cloud

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • 成本管理

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • Azure DNS

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • 网络观察程序

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • 恢复服务保管库

    • Contoso SKU 选择:默认(异地冗余存储 (GRS))
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
    • 注意
      • 跨区域还原 将启用 DR 演练,客户故障转移到次要区域。
  • 虚拟网络(VNet),包括子网、用户定义的路由(UDR)和网络安全组(NSG)

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要使用附加的 UDR 和 NSG 将基础和数据平台 VNet 重新部署到次要区域。
    • 注意
      • 流量管理器可用于在拥有副本 VNet 结构的区域之间对流量进行异地路由。 如果它们具有相同的地址空间,则它们无法连接到本地网络,因为这会导致路由问题。 当一个区域中的 VNet 发生灾难和丢失时,可以将可用区域中具有匹配地址空间的其他 VNet 连接到本地网络。
  • 资源组

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将 Foundation 和数据平台资源组重新部署到次要区域。
    • 注意
      • 通过实施“暖备用”策略来缓解此活动,并在次要区域中提供网络和资源组拓扑。
  • Azure 防火墙

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 Foundation Azure 防火墙重新部署到次要区域。
    • 注意
      • 可以使用可用性区域创建Azure 防火墙以提高可用性。
      • “暖备用”策略可缓解此活动。
  • Azure DDoS

    • Contoso SKU 选择:网络保护
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要为基础的 VNet 在次要区域中创建 DDoS 保护计划
  • ExpressRoute - 线路

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
    • 注意
      • 物理线路仍将由Microsoft和连接合作伙伴负责恢复。
  • VPN 网关

    • Contoso SKU 选择:VpnGw1
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 Foundation VPN 网关重新部署到次要区域。
    • 注意
      • 可以使用可用性区域创建VPN 网关以提高可用性。
      • “暖备用”策略可缓解此活动。
  • 负载均衡器

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 Foundation 负载均衡器重新部署到次要区域
    • 注意
  • Azure DevOps

    • Contoso SKU 选择:DevOps 服务
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
    • 注意

区域:数据平台组件

  • 存储帐户 - Azure Data Lake Gen2

    • Contoso SKU 选择:本地冗余存储 (LRS)
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要重新部署数据平台存储帐户,并使用次要区域中的数据将其解除冻结。
    • 注意
      • 存储帐户具有广泛的 数据冗余 选项,从主要区域冗余到次要区域冗余。
      • 对于次要区域,冗余数据将以异步方式复制到次要区域。 如果主要区域不可恢复,影响主要区域的故障可能会导致数据丢失。 Azure 存储通常具有不到 15 分钟的恢复点目标(RPO)。
      • 在区域性服务中断的情况下,异地冗余的存储帐户将在次要区域中作为 LRS 提供。 需要应用其他配置才能提升次要区域中的这些组件,以便异地冗余。
  • Azure Synapse - 管道

    • Contoso SKU 选择:计算优化 Gen2
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将数据平台 Azure Synapse Analytics 部署到次要区域并重新部署管道。
    • 注意
      • 自动还原点在 七天后删除。
      • 用户定义的还原点可供使用。 目前,有 42 个用户定义的还原点上限,这些还原点在 7 天后自动删除。
      • Synapse 还可以在本地或远程区域执行 DB 还原,然后立即暂停实例。 此过程只产生存储成本,不产生计算成本。 这提供了一种在特定时间间隔内保留“实时”数据库复制的方法。
  • Azure 事件中心

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将事件中心实例重新部署到次要区域。
    • 注意
  • Azure IoT 中心

  • Azure 流分析

    • Contoso SKU 选择:标准
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将IoT 中心重新部署到次要区域。
    • 注意
      • 流分析的关键功能是能够从 节点故障中恢复。
  • Azure AI 服务(前身为认知服务)

    • Contoso SKU 选择:即用即付
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
  • Azure 机器学习

    • Contoso SKU 选择:常规用途 - D 系列实例
    • DR 影响
      • Azure 数据中心故障:Contoso 需要验证可用性并在必要时重新部署。
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将机器学习重新部署到次要区域。
    • 注意
      • 虽然机器学习基础结构由 Microsoft 管理,但相关资源由客户管理。 默认情况下,只有密钥库高度可用。
      • 根据支持的服务关键性,Microsoft建议使用 多区域部署
  • Azure Synapse - 数据资源管理器池

    • Contoso SKU 选择:计算优化,小型(4 核心)
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要重新部署 Azure Synapse – 将池和管道数据资源管理器到次要区域。
  • Azure Synapse - Spark 池

    • Contoso SKU 选择:计算优化 Gen2
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将 Azure Synapse – Spark 池和管道重新部署到次要区域。
    • 注意
  • Azure Synapse - 无服务器和专用 SQL 池

    • Contoso SKU 选择:计算优化 Gen2
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 需要将数据平台 Azure Synapse Analytics 部署和 还原 到次要区域。
    • 注意
      • 自动还原点在 七天后删除。
      • 用户定义的还原点可供使用。 目前,有 42 个用户定义的还原点上限,这些还原点在 7 天后自动删除。
      • Synapse 还可以在本地或远程区域执行 DB 还原,然后立即暂停实例。 这只产生存储成本,不产生计算成本。 此解决方案提供了一种在特定时间间隔内保留“实时”数据库复制的方法。
  • Power BI

    • Contoso SKU 选择:Power BI Pro
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:N/A
    • 注意
  • Azure Cosmos DB

    • Contoso SKU 选择:具有定期备份的单区域写入
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:N/A
      • Azure 区域故障:Contoso 应监视,确保剩余区域中有足够的 预配请求单位(RU), 以支持读取和写入活动。
    • 注意
      • 发生区域性服务中断时,单区域帐户可能会失去可用性。 若要确保 Azure Cosmos DB 实例的高可用性,请使用单个写入区域和至少一个(读取)区域对其进行配置,并启用服务托管故障转移。
      • 为避免写入可用性丢失,建议使用“启用服务托管故障转移”配置生产工作负荷,从而自动故障转移到 可用区域
  • Azure AI 搜索(以前称为认知搜索)

    • Contoso SKU 选择:标准 S1
    • DR 影响
      • Azure 数据中心故障:Contoso 需要验证可用性并在必要时重新部署。
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 AI 搜索重新部署到次要区域。
    • 注意
  • Azure Data Share

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:Contoso 需要验证可用性并在必要时重新部署。
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 Data Share 重新部署到次要区域。
    • 注意
      • 可用性区域目前不支持 Azure Data Share。
      • 将 Data Share 提升到 HA 部署 将解决其中每个中断风险。
  • Purview

    • Contoso SKU 选择:不适用
    • DR 影响
      • Azure 数据中心故障:N/A
      • 可用性区域故障:Contoso 需要验证可用性并在必要时重新部署。
      • Azure 区域故障:Contoso 需要将 Microsoft Purview 实例部署到次要区域。
    • 注意
      • 通过实现“暖备用”策略,在次要区域中提供第二个可用的 Microsoft Azure Purview 实例,可以缓解此活动
      • “暖备用”方法具有以下重要注意事项
        • 不得将 Microsoft Azure Purview 主要和次级帐户配置为相同的 Azure 数据工厂、Azure Data Share 和 Azure Synapse Analytics 帐户(如适用)。 因此,Azure 数据工厂 和 Azure Data Share 的世系无法在辅助 Azure Microsoft Purview 帐户中看到。
        • 集成运行时特定于 Azure Microsoft Purview 帐户。 因此,如果扫描必须在主要和辅助 Azure Microsoft Purview 帐户中并行运行,则必须维护多个自承载集成运行时。

注意

本部分旨在作为一般指导。 应查阅供应商有关灾难恢复、冗余和备份的文档,了解正在考虑的新组件或服务的正确方法。

“Azure 数据中心故障”涵盖受影响区域未提供可用性区域的情况。

如果在发生灾难事件时提供了新的/更新后的配置或版本,则作为将平台更新到当前日期工作的一部分,应该对其进行检查和重新部署(如有必要)。

后续步骤

了解方案详细信息后,可以了解 与此方案相关的建议。