了解警示關聯性
上次修改主題的時間: 2015-03-09
關聯性引擎位於 MicrosoftExchange Server 2010 監控管理組件的核心。關聯性引擎的開發目的旨在顯著減少因管理組件所引發的警示數目。
在 Exchange 2007 管理組件中,當監視器狀態由綠轉紅時,便會發出警示。這類型的警示在 Exchange Server 2010 管理組件中便會關閉。而改由關聯性引擎來處理警示。它會處理來自管理組件監視器的資料,然後決定是否要發出警示。關聯性引擎能協助監視 Exchange 環境的管理者僅專注於可能需要做出行動的警示。
架構
關聯性引擎是獨立的 Windows 服務,它使用 Operations Manager SDK 介面先擷取健康狀態模型 (或執行個體空間),然後再處理狀態變更事件。透過在記憶體中維護健康狀態模型,並處理狀態變更事件,關聯性引擎便可依據系統狀態判斷何時提出警示。
此圖表顯示數個監視器會針對問題變更狀態,並且由代理程式將對應的狀態變更事件,轉送到 Root Management Server (RMS)。這些事件由 RMS 接收之後,會由關聯性引擎來進行處理,進而可以透過 RMS 的軟體開發套件 (SDK) 介面提出警示。接著此警示會在 Operations Manager 主控台上顯示。
警示分類
Exchange Server 2010 監控管理套件警示分成三種類別之一。使用下列方針來了解這些警示的分類。
關鍵健康狀態指示器 (KHI) KHI 是指影響服務健康狀態的問題。大部分的警示都是屬於這種類別 (例如,「信箱資料庫已卸載」)。
非服務影響 (NSI) NSI 監視器偵測可能影響系統的部分 (非所有) 使用者的問題。NSI 狀況的典型範例:兩位使用者擁有相同的 Proxy 位址,傳送電子郵件到此位址會因為無法傳遞而被退回,但整體傳輸系統並未遭受其他損害。
鑑識 鑑識監視器可用來記錄疑難排解問題時的相關資訊,這些資訊未必代表系統現在或即將出現故障。鑑識問題的範例:「CPU 活動超過 90%,已持續 5 分鐘」,這說明可能有一個處理序正在異常佔用 CPU 週期,或者伺服器可能已重新啟動,並趕上正常的系統活動。這些監視器會顯示在警示內容的「警示內容」欄位上,以及「健全狀況總管」上。鑑識監視器不產生警示。
附註: |
---|
發出單一鑑識監視器警示時,不會更新狀態。不過,可能會依據每一個元件目前鑑識監視器警示的彙總來更新狀態。 |
警示嚴重性
Exchange Server 2010 監控管理組件警示也依警示嚴重性分類,如下所示:
錯誤警示 錯誤警示指出需要立即注意的嚴重問題。
警告警示 警告警示指出可能在未來造成問題的狀況。
資訊性警示 資訊性警示不會由 Exchange 2010 管理組件引發。
關聯性因素
關聯性引擎依據許多因素來決定採取的動作,包含以下:
監視器狀態變更事件 監視器會從像是事件記錄訊息、效能計數器閾值及 PowerShell 工作輸出事件等來源,收集 Exchange 環境的診斷資訊。監視器會在偵測到有問題發生或解決時 (即由紅轉綠或由綠轉紅時) 登錄狀態變更事件。當無法聯繫 Exchange 伺服器,或 Exchange 伺服器變成可用時,監視器也會登錄狀態變更。最後,當 Exchange 伺服器處於維護模式時,或是脫離維護模式時,監視器會登錄狀態變更。在 Exchange 2007 管理組件中,當監視器狀態由綠轉紅時,便會發出警示。在 Exchange 2010 管理組件中,警示不會因監視器狀態變更而自動產生。關聯性引擎會判斷是否要發出警示。Exchange 2010 管理組件包含對每個監視器的警示規則。這讓監視人員可以使用 Operations 主控台來存取管理組件中每個監視器的內容。甚至在監視器自身不產生警示時,他們也可以為每個特定的監視器在 [公司知識] 欄位中輸入公司特定記事。
健康狀態模型 由 Exchange 2010 管理組件匯入 Operations Manager 的類別階層包含了定義整個系統中元件依存性的類別關係。定義這些依存性可協助 Exchange 2010 管理組件瞭解 Exchange 組織的健康狀況。例如,如果 Exchange 2010 管理組件將 Active Directory 識別為離線,它還會通報 Exchange 通訊功能不完整。
計時 關聯性引擎每隔 90 秒運作一次。當多個監視器同時發生狀態變更事件時,關聯性引擎會等候以查看是否偵測到其他可能相關的故障,以便能夠讓關聯性引擎最有效地判斷根本原因。
關聯性演算法
相互關聯性引擎程序的概觀
關聯性引擎會連接至 Operations Manager SDK 服務,以下載健康模型階層和執行個體狀態。這只有在服務啟動或是當錯誤需要而有需求時才會發生。
關聯性引擎會在 Exchange 管理組件中向 Operations Manager 查詢實體相關的最新狀態變更事件。
如果偵測到新的非服務影響狀態變更,關聯性引擎會對它們發出警示。
關聯性引擎會隔離所有處於紅色狀態的關鍵健康狀態指示器監視器的資料。關聯性引擎會將該資料安排入邏輯分組,顯示每個程序所依賴及被依賴的相關程序。這些分組通常被稱為「關鍵健康狀態指示器鍊」。每個「鏈」均指出相依性失敗及影響一個或更多相依程序的問題。
關聯性引擎會為每個關鍵健康狀態指示器鍊發出警示。每個關聯性引擎所發出的警示會指出了每個問題的根本原因。
關聯性引擎會等待 90 秒,接著從步驟 2 重新開始。
關聯性引擎程序的其他相關資訊
如果關鍵健康狀態指示器的鏈同時包含錯誤和警告監視器,則警示會以錯誤的形式發出,而不論根本原因監視器的類別為何。例如,如果頂層處理序定義錯誤監視器以捕捉故障實例,並且如果它是在相依性方面與警告監視器相關,則會依相依性發出警示。但會將它標記為錯誤,而不是警告。
並非每個類別關聯性都用於警示關聯性。如需關聯性引擎所使用的特定關係之詳細資訊,請參閱本指南稍後的附錄:類別階層。
包括所有鑑識監視器的關鍵健康狀態指示器鏈包含在 [警示內容] 欄位 (顯示在最終警示的內容中) 上。這能讓管理員可以檢閱與特定警示相關聯的監視器。自依存性監視器所發出的警示必須經過檢閱,以判斷該警示所提及的特定失敗。
哪些事項受或不受警示關聯性影響
瞭解哪些事項受或不受關聯性引擎影響,是相當重要的。
由於加入了關聯性引擎,下列功能在 Exchange 2010 管理組件中有所不同:
當狀態變更事件發生時,監視器不會自動發出警示。這會使關聯性引擎判斷要產生的最佳警示。
當關聯性引擎停止時,Exchange 2010 管理組件不會發出對應您的 Exchange 環境健康之警示。若關聯性引擎停止,便會產生一般警示,以通知您關聯性引擎未運作。
下列功能不會因加入關聯性引擎而有所改變:
覆寫仍然如預期般運作。您可以如您今天所做的一樣,變更某些值或停用監視器。
關聯性引擎會略過維護模式下的監視器與物件。無需任何特殊考量,因為監視器不會發出狀態變更事件。
其他管理組件,不受關聯性引擎存在的影響。
操作說明
關聯性引擎需要在記憶體中維護管理群組的執行個體空間,以判斷相關的監視器與警示。因此,您擁有的 Exchange 伺服器和資料庫越多,關聯性引擎即需要越多的記憶體。
每個受監控的 Exchange 伺服器,關聯性引擎皆需要大約 5 MB 的記憶體空間。有一些因素可讓這個數字上升或下降,它對於瞭解資源影響伺服器主控服務,是一個很好的基準點。
Exchange 2010 管理組件中的事件監視器自動重設功能
在 Exchange 2010 管理組件中,大部分的事件監視器都會自動由關聯性引擎重設。已在這些監視器中新增自動重設功能,以便在下次問題又發生時,不會遺漏問題。下表列出了沒有自動重設功能的事件監視器。
監視器名稱 |
---|
日誌代理程式載入設定資訊時發生錯誤。 |
程序失敗,以致訊息滯留在傳送佇列中。 |
您的自動探索服務設定不安全。若要解決此問題,請停用自動探索虛擬目錄的匿名存取功能。 |
Exchange 無法建立記錄檔目錄。在失敗原因修正前,將不會產生記錄檔。事件描述中詳細說明了來源元件與錯誤成因。 |
Exchange 無法建立新的記錄檔。在失敗原因修正前,將不會產生記錄檔。事件描述中詳細說明了來源元件與錯誤成因。 |
收取目錄內發現唯讀檔案。 |
Microsoft Exchange Transport 服務偵測到嚴重的儲存錯誤,並已採取了移動資料庫的自動化修復動作。 |
檔案發佈服務:無法從 Active Directory 讀取有關離線通訊錄的安全性描述元。 |
ExBPA 警告。 |
ExBPA 錯誤。 |
無法移動信箱。 |
無法載入必要的 DsProxy DLL。 |
無法啟始化 NSPI Proxy 的效能計數器。 |
本機資料庫副本的索引已毀損。請使用 Update-MailboxDatabaseCopy 指令程式搭配 -CatalogOnly 參數重新植入目錄。 |
無法載入Microsoft Exchange 郵件提交服務的效能計數器。此相關效能物件的名稱為 MSExchangeMail Submission。 |
本機拓撲伺服器不屬於任何 Active Directory 站台。 |
Microsoft 郵件提交伺服器在嘗試載入網路拓撲資訊時發生例外情況。 |
Exchange 拓撲搜索在 Active Directory 中找不到本機 Exchange 伺服器。 |
程序失敗,以致訊息滯留在提交佇列中。 |
一個資料庫副本遇到嚴重的遺失清除錯誤,所有資料庫副本可能皆已受影響。 |
一個使用中資料庫副本遇到嚴重的遺失清除錯誤,所有資料庫副本可能皆已受影響。 |
一個本機資料庫副本遇到嚴重的遺失清除錯誤,所有資料庫副本可能皆已受影響。 |
資料庫引擎已消耗資料庫 99% 的 "b-trees" 資源 (87696 的上限中已使用 87048)。 |
無法移除資料庫副本的增量重新植入檔案。 |
無法移除資料庫副本的連續複寫檔案。 |
單頁還原程序已開始修正資料庫副本中的錯誤。 |
單頁還原程序已成功修正資料庫副本中的錯誤。 |
無法移除資料庫的記錄檔。該檔案可能正在使用中或是該服務沒有足夠的權限。 |
所指定的關聯性間隔值小於允許的最小值。 |
所指定的關聯性時間間隔值小於允許的最小值。 |