选择 SharePoint Server 的灾难恢复策略
适用于:2013 2016 2019 Subscription Edition SharePoint in Microsoft 365
我们将灾难恢复定义为从承载 SharePoint Server 服务器场的主数据中心无法继续运行时从中恢复的功能。 不论事件本质及其原因如何,数据中心中断都是严重事件,必须启动在组织的灾难恢复计划中定义操作。 这意味着使用位于不受事件影响的数据中心中的计算机资源将完全运行的服务器场投入生产。
SharePoint Server 2019、2016、2013 以及支持它们的 SQL Server 提供了配置和内容恢复选项,这些选项可以满足恢复时间目标 (RTO) 和恢复点目标 (RPO) ,这是发生灾难时业务所需的。 有关这些和其他灾难恢复概念的详细信息,请参阅 SharePoint Server 中的高可用性和灾难恢复概念。
简介
SharePoint Server 服务器场的有效灾难恢复策略必须足以满足组织的业务需求,通常使用两个度量表示:恢复时间目标 (RTO) 和恢复点目标 (RPO)。 RTO 和 RPO 要求通过确定发生灾难时组织的停机时间成本来决定。
重要
[!重要说明] 作为最佳做法,我们建议您在制定恢复策略和实施技术解决方案之前确定并量化组织的 RTO 和 RPO。 重点关注什么是必需的,而不是如何做。
各行业之间和行业内部的停机时间成本差异很大,特别是由于停机时间的不同影响。 业务规模是最明显的因素。 但是,它不是唯一的。 设置度量值意味着确定失败的性质和含义。 降低到最简单的级别,关键应用程序的故障可能会导致以下类型的损失:
应用程序服务的损失。 停机时间的影响因应用程序和业务而异。
数据丢失。 因系统中断造成的潜在数据丢失可能导致重大的法律和财务影响。
大多数组织都可能因上述两种类型的损失而遭受停机时间成本,但业务性质将确定哪种类型的损失的影响最大。 Chris Preimesberger 在 eWEEK 上发表的以下文章重点介绍了数据中心停机时间的财务影响。 计划外 IT 停机时间可能每分钟花费 5000 美元:报表。
大多数情况下,SharePoint 产品 是出现数据中心中断(即灾难)时必须恢复的几个应用程序之一。 因此,我们未包含有关灾难恢复规划的信息,但重点介绍用于确保可以在其他位置恢复 SharePoint 服务器场的选项。
不论灾难的类型和规模如何,恢复涉及使用您可以将服务器场恢复到的备用数据中心。
备用数据中心恢复选项
如果当地冗余系统和备份系统无法从主数据中心中断恢复,将需要备用数据中心。 使替换服务器场在其他位置启动并运行的时间和即刻努力通常称为热待机、温待机或冷待机。 我们对这些服务器场恢复数据中心的定义如下:
冷待机 。 可以在数小时或数天内提供可用性的辅助数据中心。
温待机 。 可以在数分钟或数小时内提供可用性的辅助数据中心。
热待机 。 可以在数秒或数分钟内提供可用性的辅助数据中心。
这些备用数据中心每一个都有特定的特征和要求,且具有运营和维护相关成本。
冷待机灾难恢复策略:业务随附备份,以支持本地和区域脱机存储的定期裸机恢复,且签订了在其他区域的应急服务器租赁合同。
Pros: 通常是运营成本最低的维护选项。 但通常是成本高昂的恢复选项,因为它要求必须在发生灾难后正确配置物理服务器。
缺点:最慢的恢复选项。
Azure Site Recovery 提供热备份灾难恢复策略。
Pros: 通常是成本相当低廉的恢复选项,因为虚拟服务器场要求在恢复后执行的配置几乎很少。
Cons: 维护起来可能很耗时,且成本非常高昂。
热备用灾难恢复策略:运行多个数据中心,但仅通过一个数据中心提供内容和服务的业务策略。
Pros: 通常恢复速度相当快。
Cons: 配置和维护成本可能非常高昂。
重要
不论您决定应用上述哪个灾难恢复解决方案,可能都会出现一定程度的数据丢失。
冷待机恢复
在冷备用灾难恢复方案中,可以通过在新位置设置新场进行恢复, (最好是使用脚本化部署) 和还原备份。 或者,可以通过使用备份解决方案(如 System Center - Data Protection Manager (DPM) )还原场进行恢复。 DPM 在计算机操作系统级别保护你的数据,并允许你单独还原每个服务器。 本文不包含有关在冷待机方案中如何创建和恢复的详细说明。 有关详细信息,请参阅:
温待机恢复
在温待机灾难恢复方案中,您可以通过在备用数据中心创建重复服务器场来创建一个温待机环境,并确保使用主服务器场的完全和增量备份定期更新。
虚拟服务器场待机环境
虚拟化提供了用于温待机恢复解决方案的经济有效的可行选项。 您可以使用 Hyper-V 作为内部解决方案,或使用 Azure 作为托管解决方案,以提供必要的恢复基础设施。 有关详细信息,请参阅 在 Azure 中使用 SQL Server Always On 可用性组部署 SharePoint Server
热待机恢复
在热待机灾难恢复方案中,您可在待机数据中心设置故障转移服务器场,以便它可以在主服务器场脱机后立即使用生产运营。 具有单独故障转移服务器场的环境具有以下特征:
必须在故障转移服务器场上维护单独的配置数据库和 SharePoint 管理中心网站内容数据库。
所有自定义项都必须部署在这两个场上。
提示
两个场相互一致,并且为了降低错误可能性,我们建议您使用脚本部署创建使用相同配置设置和自定义项的主服务器场和故障转移服务器场。
操作系统、SQL Server 和 SharePoint Server 软件更新必须应用到两个服务器场,以维护两个场之间的一致配置。
可以使用异步镜像、可用性组复制的异步提交或日志传送将 SharePoint Server 内容数据库传送到故障转移服务器场。
注意
SQL Server 镜像仅用于将数据库复制到单个镜像服务器,但您可以将日志传送到多个辅助服务器。
SQL Server 数据库镜像功能将在未来的版本中删除。 建议避免在新部署中使用此功能。 请计划更改当前使用该功能的应用程序。 请改用 Always On 可用性组。
在是否可以将日志传送到服务器场方面,服务应用程序各不相同。 有关详细信息,请参阅本文稍后的服务应用程序冗余。
热待机服务器场拓扑可以在多个数据中心之间重复,只要您对一个或多个额外数据中心配置 SQL Server 日志传送。
重要
[!重要说明] 使用故障转移方法进行灾难恢复时,主要考虑因素包括可用网络带宽和延迟。 建议咨询 SAN 供应商,以确定是否可以将 SAN 复制用于 SQL 数据库或其他受支持的机制,以提供跨数据中心的热备用级别可用性。 请注意,不支持对 SharePoint 服务器使用 SAN 复制。
服务应用程序冗余
要在服务应用程序的数据中心之间提供可用性,我们建议对跨场运行的服务运行可以从主数据中心和辅助数据中心访问的单独服务场。
对于不能跨场运行的服务,为了给服务场本身提供可用性,在服务应用程序的数据中心之间提供冗余的策略有所不同。 采用的策略取决于是否满足以下条件:
在未使用的灾难恢复场中运行服务应用程序是否具有商业价值。
与服务应用程序相关的数据库是否可以进行日志传送、异步镜像或使用异步提交复制。
服务应用程序是否可以针对只读数据库运行。
在设计使用温待机或热待机数据中心的灾难恢复解决方案之前,请阅读 SharePoint 数据库的受支持的高可用性和灾难恢复选项一文。
用于恢复的系统要求
在理想情况下,故障转移组件和系统在所有方面符合主要组件和系统:平台、硬件和服务器数量。 故障转移环境必须至少能够处理预计在故障转移时出现的流量。 请记住,只有少数用户可以由故障转移网站提供服务。 系统必须至少满足以下条件:
操作系统版本和所有更新
SQL Server 版本和所有更新
SharePoint Server 版本和所有更新
除了以前的要求外,服务器场恢复时间也会受设施和基础设施组件的可用性影响。 请确保满足以下要求:
电源、冷却、网络、目录和 SMTP 完全冗余
选择切换机制;DNS 或硬件负载平衡是否符合您的需求。
另请参阅
概念
SharePoint Server 中的高可用性和灾难恢复概念