Freigeben über


两个常见的DPM 2007控制台崩溃问题的故障排除

[原文作者 Tyler Franke]

在这篇帖子里,我将讨论两个有关System Center Data Protection Manager 2007控制台启动的常见错误,以及产生这些错误的常见原因,并且讨论下如何简单的解决这些问题。

第一个是ID:917错误。如下图所示,这个是一个最常见的典型错误。可以很容易的通过错误ID来辨别它,同时在错误窗口上会有这样一条消息:Connection to the DPM service has been lost。

 

对于这个类型的错误,你首先需要做一些检查。

第一件事就是要确保错误信息里列出来的那些服务都已经启动了。

接着,就像错误本身提示的那样,是由于数据库运行在恢复模式下导致的。解决这个问题的首选方法是打开命令提示符(Windows Server 2008以上版本需要管理员权限运行),然后启用-sync选项来运行DpmSync.exe工具。大多数情况下,这样就可以清除DPM数据库的dbRecovery 标志,允许服务正常启动,控制台也就可以打开了。另外,你也可以使用下面的步骤手动的检查数据库。不过我们强烈建议你在打开和修改数据库之前,使用Dpmbackup.exe 工具来备份DPM数据库。

1)  使用SQL Management Studio连接到SQL Server及DPM数据库

2)  展开 Databases -->DPMDB -->Tables -->dbo.tbl_DLS_GlobalSetting

3)  右击,选择Open Table

4)  如果DbRecovery的值为1,则将其改为0

5)  重启DPM服务

 

另外,在启动DPM管理员控制台时候还有一些其他常见原因会引起ID:917错误。

1)  连接主持DPM数据库的远程SQL Server时出现问题。我发现测试连接问题最简单的方法是创建一个新的文本文件并将它的扩展名改为.UDL。比如,如果你的文本文档是SQL.txt,可将其重命名为SQL.udl。改好之后,双击文件,输入远程SQL Server的名称以及数据库名称(默认的DPM数据库名称是MS$DPM2007$)。然后单击Test Connection按钮来测试服务器与SQL Server和数据库的连接情况,如下图所示。如果你发现存在连接问题,你就需要重点关注网络、SQL Server、名称解析等,以确定为什么DPM服务器不能连接到远程SQL Server或者它自己的数据库上。

2)  DPM安装驱动盘或者"MICROSOFT$DPM$2007账户启用了磁盘限额。这种情况下,请禁用磁盘限额,或者设置MICROSOFT$DPM$2007账户为无限制的。有关磁盘限额及其管理的更多信息请参阅帖子后面的相关链接。

3)  由磁盘问题、文件系统崩溃等引起的DPM数据库崩溃。对于这种情况,你需要利用最新的备份来还原DPM数据库。有关DPM数据库备份和还原的更多信息请参阅帖子后面的相关链接。

4)  缺少本应存在于路径C:\Program Files\Microsoft DPM\DPM\Temp\MTA下的DPM临时目录,或者存在此目录但是没有共享。此时,需要重新创建C:\Program Files\Microsoft DPM\DPM\Temp\MTA目录,或者重新共享MTA文件夹,共享名为MTATemptStore$。

5)  如果创建了磁带库共享,那么就需要验证库服务器是否可以连接上(Ping,UNC等)。而如果你不再需要使用磁带库共享,那么就应该禁用它。

 

接下来,我们再来看另外一个常见的错误,它也会经常导致无法启动DPM管理员控制台。这个错误就是ID:948:

ID:948错误和我们上面看到的第一个错误有一些相同的地方,不过我们还会再回顾一下这部分内容,当然也会看一下出现这个错误所特有的潜在原因。

1)  首先确定DPM服务自身没有被禁用,而是设置成了手动启动方式。如果服务没有运行,你也可以尝试去手动启动它。

2)  然后,你需要使用前面提到的步骤去验证DPM数据库是否处于恢复模式。如果是的话,就要手动修改或者使用命令提示符(windows server2008 以后版本使用管理员权限运行)运行Dpmsync.exe -Sync命令来移除dbRecovery模式。

3)  对于这个类型的错误,我们也需要验证DPM服务器上的SQL Server服务没有被禁用。如果它没有被禁用,那么建议你进一步验证SQL Server服务的登录账户信息。默认使用的是MICROSOFT$DPM$Acct账户,这是在DPM安装时创建的本地用户账户。

4)  接着查看DPM服务器上本地组MSDPMTrustedMachines 和DPMRADmTrustedMachines里是否有未解析的计算机账户。如果有,那么就要修正错误使得账户可以被解析,或者就简单的将他们从组里删除。未解析的账户可以很容易的识别出来因为它们会显示为安全标识符,如下图所示:

 

5) 和前面的错误一样,ID:948错误也可能是由DPM数据库崩溃引起的。这时你需要利用最新的备份来恢复DPM数据库。有关DPM数据库备份和恢复的更多信息请参阅文章后面的链接。

 

如果上面的方法都没有解决你的问题,那么你可能就需要向微软开一个支持案例来帮助解决它了。还有一点需要牢记的是,在你向微软技术支持工程师寻求帮助时,你可以先做一些前期工作,这样有助于加快案例的解决。

1) 在DPM服务器上下载并安装DPM MPS报告工具,来收集数据。这个工具可以从帖子最后提供的链接下载到。

2) 请查找并收集在 %WINDIR%\PCHealth\ERRORREP\QSIGNOFF目录下的任何扩展名为.dmp的文件。

3) 如果DPM服务器运行在Windows Server 2003上时,请在“开始”菜单的命令提示符上运行命令DRWTSN32 -i来启用DR Watson作为默认的应用程序调试器。完成之后,检查并收集 %WINDIR%\PCHealth\ERRORREP\QSIGNOFF目录下的任何扩展名为.dmp的文件。

4) 在DPM服务器上下载并安装windows调试工具。安装完成后,在重现问题时你就可以使用ADPLUS捕获一个MSDPM.exe进程的转储。你需要执行命令:cscript Adplus.vbs –crash –pn msdpm.exe –fullonfirst –o c:\adplus,这里的输出文件夹c:\adplus可以被替换成你预先创建的其他文件夹。

重要链接

使用DpmBackup来创建备份卷影拷贝:https://technet.microsoft.com/en-us/library/cc161258.aspx

 如何恢复DPM数据库:https://technet.microsoft.com/en-us/library/bb808944.aspx

 设置磁盘限额:https://technet.microsoft.com/en-us/library/dd163561.aspx

 System Center Data Protection Manager 2007下载:https://www.microsoft.com/downloads/en/results.aspx?freetext=%22data+protection+manager+2007%22&displaylang=en&stype=s_basic

 DPM MPS 报告:https://www.microsoft.com/downloads/details.aspx?familyid=14392186-6707-45a5-8987-29665abbd6f5&displaylang=en&tm

 Windows调试工具:https://www.microsoft.com/whdc/devtools/debugging/default.mspx

 286350 如何使用ADPlus来排除"hangs" 和 "crashes"故障:https://support.microsoft.com/default.aspx?scid=kb;EN-US;286350

[本博文仅供参考,微软公司对其内容不作任何责任担保或权利赋予]