Project Server 2007 的嚴重損壞復原最佳作法
更新日期: 2009年3月
上次修改主題的時間: 2009-03-02
一個嚴重損壞復原規劃應確保您的所有系統和資料在經歷天然災害 (例如火災) 或技術災害 (例如 RAID-5 陣列發生兩個磁碟失敗) 之後,能快速地還原回正常運作的狀態。當您建立嚴重損壞復原規劃時,應該識別出發生重大事件時必須回應的所有動作。
在生產環境部署 Microsoft Office Project Server 2007 之前,請先徹底地測試您的備份與復原規劃。測試時,請盡可能模擬失敗案例,找出容易受傷害的區域。建議您模擬重大事件發生時的情形,藉此確認您的嚴重損壞復原規劃。
規劃您的嚴重損壞復原策略時,請考慮下列問題:
您要將備份傳送至何種媒體 (磁帶或磁碟)?
您要手動備份或排程自動備份?
若要自動備份,您要如何確認自動備份是否成功?
您要如何確保備份是可以使用的?
在重複使用媒體之前,您要將備份保存多久時間?
假設發生失敗,要花費多少時間才能從最新的備份還原?那是可接受的停機時間嗎?
您要將備份儲存在何處,以及適當的人員是否可以存取備份?
如果負責的系統管理員不在,是否有其他人知道正確的密碼和程序可以執行備份,並在需要時還原系統?
在任何嚴重損壞復原規劃中,建議您採取下列動作:
每天使用 Microsoft Windows 事件檢視器檢查生產伺服器上的系統記錄和應用程式記錄,看看是否有任何錯誤或警告。
永遠維持最新的 Windows 緊急修復磁片或系統自動修復 (ASR) 組以供部署中的每部伺服器使用。如需詳細資訊,請參閱 Windows 說明。
確認所有伺服器都受到適當防毒軟體的保護。以最新的病毒簽章檔案將軟體保持在最新狀態。請使用防毒應用程式的自動更新功能,使病毒簽章保持在最新狀態。
事件類型
系統管理員必須保護他們的網路,避免發生資料遺失和系統停機的情形。其中牽涉到持續執行的例行程序,以及為避免未預期的停機或從停機復原所採取的非例行步驟。
造成系統停機的一些可能原因包括:
硬碟子系統失敗
電源失敗
系統軟體失敗
意外或惡意使用刪除或修改命令
破壞性的病毒
天然災害
竊取或破壞
發生上述事件的可能性會因貴組織而有所不同,不過這些事件都會嚴重影響您的 Office Project Server 2007 部署。建議您依據各種事件類型評估您的弱點,然後採取適當的步驟,減輕組織在那些事件下暴露弱點的程度。
硬碟空間考量
您的硬碟必須具備足夠的空間,才能在執行 SQL Server 的電腦還原資料庫和記錄檔。若您的備份太大,將難以還原回它的原始位置。例如,每週執行一次的標準備份再加上六天份的差異備份,還原期間可能會需要用到比伺服器上的可用磁碟空間還多的空間。
此外,您絕不能讓資料庫磁碟機上的空間超過半滿。儘管不到半滿的資料庫磁碟機會造成未使用的磁碟空間,但是基於下列理由,它仍然可以減少延伸伺服器停機時間:
您可以比磁碟機已滿時更快速地還原資料庫 (特別是在檔案系統已分割的時候)。
您可以先將資料庫備份至相同的實體磁碟,然後再進行還原,如果還原期間發生問題,這讓您可以嘗試修復資料庫 (例如,現有備份包含錯誤)。
使用硬體標準
為硬體採用一套標準,並盡可能地套用這套標準。在所有的電腦上使用相同種類的元件,例如網路卡、磁碟控制卡和圖形卡。為所有應用程式使用這個標準電腦設定檔,即使它超乎某些應用程式的需求亦然。您應對硬體進行的唯一修改,就是記憶體的數量、CPU 數量,以及硬碟設定。
硬體標準可為貴組織帶來下列優點:
只擁有一個平台,這可減少所需的測試次數。
套用驅動程式更新或應用程式軟體更新時,您只需執行一個測試,就能將更新部署至所有電腦。
由於只支援一種系統,因此,支援人員所需的訓練較少。
您不需要在組織內囤積許多備用零件,這可減少組織的成本。
請在現場存放備用零件和替代零件,並將備用設備包含在任何硬體預算內。存放於他處的備用零件數量會依設定及使用者和作業人員可以忍受的失敗狀況而有所不同。
記憶體和 CPU 等零件在原廠零件出貨後幾年都能輕易地取得,而硬碟之類零件通常在只要幾年後就很難找到。當您購買設備時,請記得購買未來可能很難取得但又必須使用的零件。您可以考慮雇用服務公司或與廠商訂定合約,委託他們購買零件,或者在核心位置存放一或兩個重要元件。
維護硬體記錄
為了縮短嚴重損壞復原期間疑難排解硬體設定問題所花費的時間,請維護目前的硬體設定記錄,其中包括:
所有硬體廠商連絡資訊的清單,其中包含電話號碼、電子郵件地址,以及線上支援的網頁。
每部伺服器內含硬體的清單,其中包含韌體更新版本和硬體驅動程式版本 (這項硬體資訊可以在 Windows 的 [裝置管理員] 中取得)。
記載基本輸入輸出系統 (BIOS) 資訊、硬碟設定資訊,以及伺服器硬體的跳接器設定的清單。
重要事項: |
---|
請離站維護這項資訊,以防設備損毀,而您必須在新位置復原系統。 |
維護軟體記錄
為了縮短嚴重損壞復原期間疑難排解軟體相關問題所花費的時間,請維護目前的軟體記錄,其中包括:
您的軟體廠商連絡資訊,其中包含電話號碼、電子郵件地址,以及線上支援的網頁。
依時間順序排列記錄伺服器上安裝的所有軟體升級 (例如 Service Pack) 和軟體修補程式的清單。保存這份清單,您就可以依照當初安裝時採用的相同順序來安裝軟體更新。
每部伺服器的設定記錄,其中包括:
伺服器名稱。
伺服器所屬的管理群組名稱。
硬碟設定資訊,其中包括每個硬碟磁碟分割的清單,裡面記載磁碟分割的磁碟區名稱和大小,以及每個磁碟分割已安裝項目的摘要。
記載任何靜態網際網路通訊協定 (IP) 位址、子網路遮罩,以及伺服器所用預設閘道的清單。
叢集設定資訊的記錄 (拓撲包含叢集的情況下)。
您對伺服器所做的任何自訂,例如 Project Web Access 自訂。
任何共用服務提供者、Web 應用程式、網站或其他設定的設定資訊。
重要事項: 請離站維護這項資訊,以防設備損毀,而您必須在新位置復原系統。
規劃硬體應變計劃
為了減少停機成本,包括銷售和生產力,您必須讓替代硬體可以立即派上用場,以供生產伺服器使用。您可以考慮擁有的替代硬體類型包括:替代備份伺服器、網路介面卡、影片及硬碟控制卡、路由器、纜線、硬碟、主機板和電源供應器。
提供訓練和文件
請確定組織內的管理員、操作員和支援人員都可以取得有關嚴重損壞復原問題的各種訓練機會和文件。
如果一或多部伺服器發生問題,後續停機可能要付出不少代價。然而,如果您在伺服器管理員、操作員和支援人員身上投資良好的訓練課程和最新的技術手冊,貴組織就能做好準備,停機的可能性也就會降低。
您也可以偶爾在獨立、非生產的網域中執行嚴重損壞復原模擬。這些模擬可以協助管理員、操作員和支援人員熟悉復原程序,同時指出您備份與復原策略的不足。接著,您可以利用這些模擬期間開發出的任何新程序或作法來更新文件。
下載本書
本主題隨附於下列可下載的叢書中,以便於閱讀與列印:
請參閱 Project Server 2007 可下載的內容 (英文)上提供的完整叢書清單。