Project Server 2007 的灾难恢复最佳方案
更新时间: 2009年3月
上一次修改主题: 2009-03-02
灾难恢复计划可以确保在发生自然灾难(如火灾)或技术灾难(例如,RAID-5 阵列中的双磁盘故障)时所有系统和数据都能迅速还原到正常的运行状态。在您创建灾难恢复计划时,应该知道为应对灾难事件所必须采取的各种操作。
在生产环境中部署 Microsoft Office Project Server 2007 之前,应仔细地检测您的备份和恢复计划。在进行检测时,应尽可能多地模拟可能出现的故障场景来查找薄弱的环节。我们建议您通过模拟灾难事件来验证您的灾难恢复计划。
规划灾难恢复策略时,请考虑以下问题:
您要将备份发送到什么介质(磁带还是磁盘)?
您要手动执行备份还是将备份安排为自动完成?
如果备份是自动完成的,将如何验证备份已经成功完成?
您将如何确保备份是可用的?
在重用介质之前,您会将备份保存多长时间?
假设发生了故障,要用多长时间才能恢复为最近的备份?这个时间是一个可接受的停机时间吗?
您将备份存储在哪里,合适的工作人员是否具有对备份的访问权限?
如果负责的系统管理员不在,是否有其他人知道相应的密码和步骤来执行备份或恢复系统(如有必要)?
作为任何灾难恢复计划的一部分,我们建议您执行以下操作:
每天使用 Microsoft Windows 事件查看器来检查生产服务器上的系统日志和应用程序日志中是否有任何错误或警告。
始终为您部署的每台服务器设置最新的 Windows 紧急修复磁盘或自动系统恢复 (ASR)。有关详细信息,请参阅“Windows 帮助”。
确保所有的服务器都受到了相应的防病毒软件的保护。并且使用最新的病毒特征文件来更新该软件。使用防病毒应用程序的自动更新功能可以使病毒特征保持最新。
事件类型
系统管理员必须防止其网络发生数据丢失和系统停机。要实现此目的,需要不间断地执行一些常规步骤,同时还要执行一些非常规的步骤以防止意外停机或从意外停机中进行恢复。
系统停机的一些潜在原因包括:
硬盘子系统故障
电源故障
系统软件故障
意外或恶意使用删除或修改命令
破坏性病毒
自然灾害
盗窃或破坏活动
是否发生这些事件要具体取决于您所在的组织,但它们都会对您的 Office Project Server 2007 部署造成负面影响。我们建议您对各种事件类型的漏洞进行评估,采取适当的步骤来最大限度地降低您的组织面临的风险。
硬盘空间注意事项
您的硬盘上必须有足够的空间来还原运行 SQL Server 的计算机上的数据库和日志文件。可能您的备份太大,无法还原到其原始位置。例如,每周执行一次的普通备份再加上六天的差异备份在还原期间可能需要比服务器能提供的可用空间更多的磁盘空间。
另外,不应使数据库驱动器上占用的空间超过一半。虽然占用空间不到一半的数据库驱动器会存在未使用的磁盘空间,但这仍然会因为以下原因使长期的服务器停机时间减少:
您还原数据库的速度会比驱动器已满的状态下更快(尤其是文件系统含有碎片的时候)。
您可以在还原数据库之前将其备份到同一个物理磁盘,这样在还原过程中,如果发生错误(例如,现有备份包含错误),将尝试修复数据库。
使用硬件标准
采用一个硬件标准,并尽可能多地应用该标准。在所有计算机上使用同一种类的组件,例如,网卡、磁盘控制器和图形卡。对所有应用程序使用此标准计算机配置文件,即使该配置文件超出了某些应用程序的需要。您对硬件所做的修改仅限于内存量、CPU 数量和硬盘配置。
硬盘标准可为您的组织提供以下优点:
只有一个平台可减少所需的测试量。
应用驱动程序更新或应用程序软件更新时,在将更新部署到所有计算机之前只需执行一次测试。
因为只需支持一种类型的系统,因此支持人员就不需要接受很多的培训。
无需在工作地点保留许多备件,可以为组织降低成本。
在工作现场保留备件和更换部件,在任何硬件预算中包括备用设备。在工作现场保留备件的数目要取决于您的配置以及用户和操作人员可以接受的故障条件。
有些部件,如内存和 CPU,在购买原始部件几年后也很容易找到相应的配件。而其他部件,如硬盘,常常在几年后就很难找到了。对于很难找到的部件,如果必须使用完全匹配的型号,请在您采购设备时计划好购买相应的备件。请考虑使用服务公司或与供应商签订合同,委托他们来提供这些部件,或者在中心工作地点保留一个或两个关键组件。
维护硬件记录
为了在灾难恢复期间节省解决硬件配置问题所花费的时间,应保留当前的硬件配置记录,其中包括:
所有硬件供应商联系人信息列表,包括电话号码、电子邮件地址和在线支持的网页。
每个服务器上的硬件列表,包括固件更新版本和硬件驱动程序版本(此硬件信息可以在 Windows 设备管理器中找到)。
有关服务器的基本输入输出系统 (BIOS) 信息、硬盘配置信息和硬件上的跳线设置的列表。
![]() |
---|
在工作地点之外保留一个此信息副本,以防您的设施被损坏,您需要在新的地点恢复系统。 |
维护软件记录
为了在灾难恢复期间节省解决相关软件问题所花费的时间,应保留当前的软件记录,其中包括:
软件供应商联系人信息,包括电话号码、电子邮件地址和在线支持的网页。
您的服务器上安装的所有软件升级(如 Service Pack)和软件修补程序的时间排序表。通过维护此列表,您可以按照这些软件的最初安装顺序来安装软件更新。
每个服务器的配置记录,包括:
服务器名称。
服务器所属的管理组名称。
硬盘配置信息,包括每个硬盘分区的列表,连同卷名和分区大小以及每个分区上安装的内容的摘要。
服务器使用的任何静态 Internet 协议 (IP) 地址、子网掩码和默认网关的列表。
群集配置信息的记录(如果您的拓扑包括群集)。
您对服务器进行的任何自定义,如 Project Web Access 自定义。
共享服务提供程序、Web 应用程序、网站或其他设置的配置信息。
重要信息
在工作地点之外保留一个此信息副本,以防您的设施被损坏,您需要在新的地点恢复系统。
对硬件意外事故进行规划
为了最大限度地减少停机时间成本(包括销售额和生产效率的降低),请随时准备好为您的生产服务器更换硬件。需要立即提供的硬件更换类型包括备用备份服务器、网络适配器、视频卡和硬盘控制器卡、路由器、缆线、硬盘、母板和电源。
提供培训和文档
确保组织内的管理员、操作员和支持人员可以得到有关灾难恢复问题的各种培训机会和相关文档。
如果一个或多个服务器遇到问题,随后的停机可能会产生高昂的成本。但是,如果您愿意为服务器管理员、操作人员和支持人员进行投资,让他们接受优秀的培训课程并为其购买最新的技术手册,那么您所在的组织就能做好充分的准备,并能减少停机的时间。
您还可以在单独的非生产领域执行临时的灾难恢复模拟操作。这些模拟操作可以让管理员、操作人员和支持人员熟悉灾难恢复过程,并了解您的备份和恢复策略中所存在的缺陷。您可以使用这些模拟期间探索的任何新步骤或实践来更新文档。
下载此书籍
本主题包含在以下可下载书籍内,以方便您阅读和打印:
有关可下载书籍的完整列表,请参阅 Project Server 2007 的可下载内容。