高可用性部署
適用版本: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1, Exchange Server 2007
上次修改主題的時間: 2008-01-17
Microsoft Exchange Server 2007 高可用性的其中一個主要開發主題,是挑戰舊版 Exchange Server 中的現有高可用性作法及組態選項。遵循 Exchange 2007 的結構規劃處理程序,就可以降低部署及作業成本,同時為使用者提供更多服務。
Microsoft 及許多客戶已將 Exchange Server 2003 中的高可用性解決方案順利部署至生產環境中,以提供高度可用的郵件環境。此外,許多客戶都已順利部署夥伴複寫技術,而且建立的解決方案會在失敗發生時自動容錯移轉至第二份資料副本。Exchange 2007 包含 Exchange 2003 中之高可用性解決方案的增強功能以及不需要協力廠商複寫技術的全新高可用性功能,而且可降低整體解決方案的成本及複雜性。而進行這些改善的重要原因有一部分是回報下列狀況的客戶的意見直接結果:
- 解決方案的共用儲存需求增加了解決方案的成本及複雜性。例如,必須從「已測試產品的 Windows Server Catalog」的「叢集解決方案」類別中選取整個解決方案的硬體。在 Exchange 2007 中,單一副本叢集 (SCC) 會維護此需求,但是在叢集連續複寫 (CCR) 環境中設定的叢集信箱伺服器則沒有此需求。
- 使用信箱資料的單一副本,表示該副本的失敗或其儲存十分擾人,常會造成長時間的中斷,而且有時會遺失資料。
- 叢集服務與 Exchange Server 之間若未整合安裝及管理,會迫使 Exchange 系統管理員必須了解叢集概念及功能。這對部分 Exchange 系統管理員而言,代表的是重要的學習曲線。
- 非預設組態設定並未調整成進行最佳復原行為。系統管理員需要手動重新設定預設叢集資源及叢集設定,以符合最佳作法建議。
- 所有 Exchange 服務 (用戶端存取、傳輸及儲存) 即使在架構上有某些極大的差異 (含不相似的高可用性策略),還是會使用相同的可用性策略來進行處理。
- 部分客戶需要夥伴技術,才能達成維護兩份使用者信箱資料的解決方案。這些解決方案增加了部署的成本及複雜性。
Exchange 2007 中的高可用性解決方案是設計來解決 Exchange 2003 高可用性方式的所有弱點。而 Exchange 2007 解決這些弱點的方式是透過變更架構、支援新組態、變更管理模型,以及引進達成高可用性的新方式。因而產生彈性的解決方案,讓每個組織可以自由地選擇符合其特定需求的解決方案。
高可用性部署選項
高可用性一律應該針對個別元件層級及整個系統或解決方案內容進行設計。一般而言,Exchange 2007 會有兩種類型的高可用性部署選項:
- 具有備援的單一資料中心部署,可以在短暫中斷之後自動復原某些失敗。如果站台失敗,則單一資料中心解決方案會依賴嚴重損壞修復程序回復作業狀態。
- 具有備援的多個資料中心部署,可以自動復原大部分的個別失敗。多個資料中心解決方案可以讓組織在資料中心失敗後存活,而不需要求助嚴重損壞修復程序。無法復原的失敗 (如整個站台失敗) 則需要手動介入來進行復原。
本主題稍後會更詳細地討論這兩種部署選項。
單一資料中心組態
Unified Messaging、Hub Transport、Client Access 及 Edge Transport server role 的單一資料中心組態都會具有組織類似的備援伺服器。針對 Mailbox Server,則會有三種高可用性組態,可提供單一資料中心內的資料及服務可用性:SCC、CCR 及本機連續複寫 (LCR)。下圖說明完整備援單一資料中心組態的一般部署。
在上圖中,摘錄了 Mailbox server role 的備援組態。這是因為組織可以使用數種選項 (含使用 SCC 及 CCR 的各種組態)。
單一副本叢集
Exchange 2007 中的共用儲存叢集組態稱為單一副本叢集 (SCC)。SCC 使用叢集服務及共用儲存來主控叢集信箱伺服器。叢集信箱伺服器是一部邏輯電腦,會在其存留時間於實體節點之間移動。叢集服務可以建立及管理「浮動網路識別碼」來達成。浮動網路識別碼是當成叢集信箱伺服器的網路識別碼。Exchange 安裝程式會使用系統管理員提供的主機名稱及 IP 位址,來自動建立此網路識別碼。浮動網路識別碼會根據節點可用性及維護需求,而在叢集的節點之間移動。如果儲存可供使用而且兩個節點至少有一個作業中,則這些機制允許使用者存取他們的信箱資料。若要讓失敗復原能夠運作,則 Exchange 與叢集服務必須搭配運作,以在失敗之後於可用的節點上讓叢集信箱伺服器連線工作。
下列是 Exchange 2007 對舊版 Exchange Server 共用儲存叢集進行的數個重要改善:
- 只有 Mailbox server role 具有叢集感知,而且是唯一可以安裝在容錯移轉叢集中的角色。
- 非預設容錯移轉行為已進行最佳化,只有在容錯移轉有極大的可能可以改善可用性時,才會進行容錯移轉。只有完整節點失敗,或節點無法與用戶端通訊時,才會進行容錯移轉。
- 大部分的管理已從叢集系統管理員中移出並移入 Exchange 工具中 (如 Exchange 管理命令介面)。這可以減少 SCC 系統管理員的學習曲線。
- 叢集信箱伺服器安裝已整合至安裝程式,提供與獨立安裝相同的體驗。
下圖說明 SCC 的一般組態。SCC 最多可支援八個至少具有一個被動節點的節點叢集。
圖 2 單一副本叢集的基本架構
在上圖中,兩個節點已加入容錯移轉叢集。該叢集使用共用磁碟來管理叢集仲裁資源 (以「仲裁」磁碟表示)。主動節點目前具有用來放置叢集信箱伺服器記錄及資料庫檔案的磁碟資源。此擁有權是以主動節點至磁碟之間的藍線表示。在此組態中,主動節點可以存取磁碟,但是被動節點無法同時存取。
主動及被動節點至少是透過兩個網路 (私人及混合) 進行連接。而這兩個網路只有一個是用來進行用戶端通訊 (混合網路)。叢集服務會定期檢查這兩個網路的通訊健康狀況。
如需 SCC 的相關資訊,請參閱單一副本叢集。
叢集連續複寫
顧名思義,單一副本叢集包含一份的信箱資料。主控信箱資料的儲存失敗並不會導致自動復原。事實上,這類失敗一般會導致延伸的中斷時間及資料遺失。針對舊叢集解決方案的 SCC 改善,解決了客戶對舊高可用性解決方案提供的大部分意見。然而,SCC 在使用共用儲存這部分仍然十分複雜。它至少有兩個非預設的單一失敗點:單一仲裁磁碟及一份 Exchange 資料。在 Exchange 2007 中,具有第兩種類型的高可用性組態,可以提供完整備援,而不需要「已測試產品的 Windows Server Catalog」的「叢集解決方案」類別中的硬體。此解決方案稱為叢集連續複寫 (CCR)。
CCR 使用內建非同步記錄傳送,在容錯移轉叢集的兩部伺服器之間複寫信箱資料。整合複寫及叢集產生的解決方案沒有單一失敗點,並提供自動復原伺服器失敗的功能。此外,也不需要使用共用儲存,因而降低了部署成本及複雜性。CCR 只支援雙節點叢集,以及只支援兩份資料 (主動副本及被動副本)。下圖說明一般 CCR 環境。
上圖說明的兩個重要變更是缺少共用仲裁磁碟,以及出現在叢集外部的第三部電腦上的檔案共用。檔案共用是新叢集仲裁功能的一部分,而這些功能是在 Microsoft 知識庫文章 921181 有更新可將檔案共用見證功能及可設定的叢集活動訊號功能新增到 Windows Server 2003 Service Pack 1 型伺服器叢集 (英文) 所述的更新引進。此更新可以讓叢集服務使用利用檔案共用的仲裁資源,而不是叢集中的 Voter 節點。如果不使用此更新,則唯一的仲裁選項是使用共用磁碟或傳統多數節點集組態,而這兩種都有其缺點,而且會增加成本:
- 使用共用磁碟又會讓解決方案重新具有共用儲存複雜性。
- 多數節點集仲裁需要三個 (含) 以上的節點。在此組態中,需要有額外的節點 (稱為 Voter 節點) 來作為叢集的 Voter 節點。
如需 CCR 的相關資訊,請參閱叢集連續複寫。
本機連續複寫
CCR 提供資料及服務的完整備援,而 SCC 則提供服務備援。針對需要資料備援但沒有服務備援的組織中,則會有本機連續複寫 (LCR)。LCR 不是叢集解決方案,因此不提供服務可用性。下圖說明一般 LCR 環境。
LCR 會使用上面 CCR 小節所述的內建連續複寫技術,在本機電腦上建立第二份 (稱為被動副本) 儲存群組。而電腦必須是獨立 (非叢集) Mailbox Server。在 LCR 環境中,系統管理員會決定哪個儲存群組具有被動副本,並在相同的伺服器上設定被動副本的第二個位置。
使用 LCR 時,系統管理員必須明確決定哪個儲存群組具有被動副本。系統管理員可以決定建立現有儲存群組的被動副本,還是在建立處理程序期間啟用新儲存群組的 LCR。而系統管理員必須為那些啟用 LCR 的儲存群組,設定記錄及資料庫檔案的第二個位置。
在 LCR 中,是以手動方式啟動第二個副本。因為容錯移轉是叢集作業,而 LCR 不是叢集解決方案,所以在 LCR 中不會進行容錯移轉。因此,系統管理員必須決定主動副本不再可用的時間,然後手動啟動被動副本,讓它成為新的主動副本。而啟動被動副本的處理程序十分簡單且快速。
系統管理員隨時都可以決定啟用 LCR 以及建立現有資料庫的被動副本,系統管理員也可以在建立新的資料庫時立即啟用 LCR。啟用 LCR 之後,會使用植入處理程序來建立基準線副本,然後再初始化複寫 (記錄傳送)。最佳作法是尋找磁碟或儲存內含上的被動副本,而被動副本是與主動副本隔離開來。此作法可以將同時發生多個失敗的機會降到最低。LCR 會影響 Mailbox Server 的資源。Mailbox Server 會執行所有與連續複寫關聯的處理,因此在規劃伺服器的容量時需要將其列入考慮。因為被動副本的大部分輸入/輸出 (I/O) 活動都是與被動副本的記錄及資料庫檔案關聯,所以主動副本上的 I/O 負載有限。
LCR 支援使用 Exchange 感知磁碟區陰影複製服務 (VSS) 來備份被動副本。如果適當地隔離內含主動副本的磁碟區與被動副本,則不含硬體型 VSS 支援的 VSS 備份會是好的選擇。來自被動副本的備份會卸載主動副本磁碟區中的備份 I/O。因為被動副本不需要即時回應用戶端,所以可以提供軟體型 VSS 編寫器的相關使用成本。此外,根據容量規劃,可能會延長具有 LCR 之伺服器上的備份時間。關鍵因素是維持整個備份時間之備份代理程式的 CPU 負載。
被動副本代表損毀及資料失敗的第一道防線。使用 LCR,第一次失敗復原的服務等級協定 (SLA) 相當短。雙重失敗則需要從備份中進行還原。使用此模型,雙重失敗的 SLA 可能會較久。因此,具有每週進行完整備份以及每日進行增量備份的選項,而且是建議使用的策略。此策略也會減少移至備份媒體的總內容。
總而言之,LCR 是絕佳的選項,可以讓組織快速從資料失敗或損毀中復原,但是可以允許排定及未排定的伺服器中斷。LCR 具有下列好處:
- 兩步驟在使用中資料庫損毀或失敗的情況下快速復原。
- 系統管理員選擇,可提供使用者最需要的保護。
- 任何大小之 Mailbox Server 及所有產品中的可用性。
- 將使用中資料庫及記錄 I/O 的影響降至最低。
- 可以卸載使用中資料庫及記錄磁碟區的備份 I/O。
- 可以減少移至備份媒體的總資料量,同時延長備份時間。
- 透過使用 Exchange 管理主控台或 Exchange 管理命令介面,摘要 Exchange 層級的管理。
如需 LCR 的相關資訊,請參閱本機連續複寫。
若要確保您目前閱讀的是最新資訊,並尋找其他的 Exchange Server 2007 說明文件,請造訪 Exchange Server 技術資源中心.