Analytics Platform System 中的管理員主控台警示
Analytics Platform System 的警示會顯示在 管理員主控台設備和 System Center Operations Manager 中。 使用此文章中的清單來識別哪些警示需要調查。
如需使用 Internet Explorer 連線至管理員主控台的資訊,請參閱<使用管理員主控台監視設備 (Analytics Platform System)>(機器翻譯)。 如需 Operations Manager 的相關資訊,請參閱<使用 System Center Operations Manager監視設備 (Analytics Platform System)>(機器翻譯)。
如需使用 Transact-SQL 取得警示資訊的相關資訊,請參閱<使用系統檢視表監視設備 (Analytics Platform System)>(機器翻譯)。
警示類型
指示 NORMAL 狀態的警示名稱通常不需要調查。 包含 NON-CRITICAL 的警示名稱有時需要採取動作。 所有其他警示類型都需要調查。
警示清單
下表依名稱的字母順序列出警示。 此清單不包括所有可能的警示。 某些警示的用與會因不同廠商而異。
警示名稱 | 是否需要採取動作? | 州 (縣/市) | 嚴重性 | 說明 | 詳細資訊 |
---|---|---|---|---|---|
Ambari 代理程式處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 此 Ambari 代理程式資源失敗 (狀態:4 ) 或為離線 (狀態:3 )。 或離線狀態擱置中 (狀態:130 )。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
檢閱標題和資料節點上的叢集資源。 |
Ambari 代理程式處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 此 Ambari 代理程式資源因下列其中一個原因而處於非嚴重狀態: – 資源處於繼承狀態 (狀態: 0 )。– 資源處於擱置狀態 (狀態: 128 )。– 資源處於上線擱置狀態 (狀態: 129 )。– 資源正在執行初始化 (狀態: 1 )。狀態會在元件的 hadoop_service_status 屬性中報告。 |
檢閱標題和資料節點上的叢集資源。 |
Ambari 代理程式處於 NORMAL 狀態。 | No | 運作 | 資訊 | Ambari 代理程式正常執行中 (狀態:Running )。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
|
Ambari 代理程式處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定此 Ambari 代理程式資源的狀態 (狀態:-1 )。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
檢閱標題和資料節點上的叢集資源。 |
應用程式活動訊號處於 NORMAL 狀態。 | No | 運作 | 資訊 | 與應用程式建立通訊成功。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
應用程式活動訊號正在擲回 CRITICAL 警示。 | Yes | 非運作 | 錯誤 | 與應用程式的通訊失敗。 應用程式可能正在重新啟動。 | 應用程式活動訊號處於非預期狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
發生叢集容錯移轉事件。 | Yes | 運作 | 錯誤 | 主要叢集節點不再處於作用中狀態,因此被動節點已接管為主要節點。 檢閱失敗節點的 Windows 事件記錄檔以取得詳細資料,並檢閱 HST01 VM 上的容錯移轉叢集管理員。 | 已發生容錯移轉。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員和節點的系統事件記錄檔。 |
叢集資源群組處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 此叢集資源群組失敗,且可能正在嘗試重新啟動或為離線。 | 資源群組狀態失敗,需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集資源群組 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 此叢集資源群組已上線,但因下列其中一個原因,而處於非嚴重狀態: – 資源群組已部分上線。 – 資源群組處於擱置狀態。 |
資源群組未完全處於預期狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集資源群組處於 NORMAL 狀態。 | No | 運作 | 資訊 | 此叢集資源群組已上線。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
叢集資源群組處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 此叢集資源群組處於未知狀態。 | 系統無法擷取叢集資源群組的健全狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集資源處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 此叢集資源失敗,且可能正在嘗試重新啟動或處於離線狀態。 | 叢集資源未處於預期狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集資源處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 此叢集資源因下列其中一個原因處於而非嚴重狀態: – 資源處於繼承狀態。 – 資源處於擱置狀態。 – 資源處於上線擱置狀態。 – 資源處於離線擱置狀態。 – 資源正在執行初始化。 |
叢集資源未處於預期狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集資源處於 NORMAL 狀態。 | No | 運作 | 資訊 | 此叢集資源已上線。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
叢集資源處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定此叢集資源的狀態。 | 系統無法擷取叢集資源的健全狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集共用磁碟區處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 此叢集共用磁碟區資源失敗 (狀態:4 ) 或為離線 (狀態:3 )。 或離線狀態擱置中 (狀態:130 )。 狀態會在元件的 csv_state 屬性中報告。 |
檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集共用磁碟區處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 此叢集共用磁碟區資源因下列其中一個原因而處於非嚴重狀態: – 資源處於繼承狀態 (狀態: 0 )。 – 資源處於擱置狀態 (狀態: 128 )。 – 資源處於上線擱置狀態 (狀態: 129 )。 – 資源正在執行初始化 (狀態: 1 )。 狀態會在元件的 csv_state 屬性中報告。 |
檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集共用磁碟區處於 NORMAL 狀態。 | No | 運作 | 資訊 | 此叢集共用磁碟區資源已上線 (狀態:2 )。 狀態會在元件的 csv_state 屬性中報告。 |
|
叢集共用磁碟區處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定此叢集共用磁碟區資源的狀態 (狀態:-1 )。 狀態會在元件的 csv_state 屬性中報告。 |
檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集狀態正常 | No | 運作 | 資訊 | 叢集處於正常狀態。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
控制器處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | PERC 磁碟指示發生嚴重錯誤,或已將控制器的電源關閉。 | 本機 RAID 控制器具有嚴重錯誤,可能需要更換。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
控制器處於 NON-CRITICAL 狀態。 | 是,如果問題持續超過 7 小時或在相同節點上重複發生多次,且未繫結至預期的重新啟動 | 已降級 | 警告 | PERC 磁碟報告了非嚴重問題,可能與纜線故障有關。 | 此事件最常指示 PowerEdge RAID 控制器電池供電快取模組上的電池充電週期。 此週期可能是排程的測試週期 (持續時間最長為 7 小時)。 當電池必須充電時,重新啟動或電源週期之後也可能會報告。 此事件通常也指示控制器的原則已暫時從寫入變更為回寫,直到充電完成。 這項變更對本機儲存體產生效能影響 ( tempdb )。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
控制器處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 錯誤 | PERC 磁碟狀態處於無法復原狀態。 | 本機 RAID 控制器無法運作。 它已進入無法復原狀態,可能需要更換。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
控制器處於 NORMAL 狀態。 | No | 運作 | 資訊 | PERC 磁碟正常執行中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
控制器處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定 PERC 磁碟的狀態。 | 系統無法擷取本機 RAID 控制器的健全狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
冷卻裝置處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | 冷卻裝置已達到嚴重狀態上下閾值。 | 冷卻裝置可能需要更換。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
冷卻裝置處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 冷卻裝置已達到非嚴重狀態上下閾值。 | 冷卻裝置尚未達到嚴重層級,但超出預期的上下範圍。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
冷卻裝置處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 冷卻裝置已達到無法復原狀態上下閾值。 | 冷卻裝置可能需要更換。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
冷卻裝置處於 NORMAL 狀態。 | No | 運作 | 資訊 | 冷卻裝置正常執行中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
冷卻裝置處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定冷卻裝置的狀態。 | 系統無法擷取冷卻裝置的狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
磁碟陣列整體處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 磁碟陣列整體處於嚴重狀態。 | 此事件可能指示由於磁碟機失敗或類似問題,因此磁碟陣列不再處於作用中狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
磁碟陣列整體處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 磁碟陣列的整體狀態指示存在非嚴重警告,但系統仍可運作。 | 磁碟陣列仍然正常運作,但此事件可能指示磁碟失敗或類似問題。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
磁碟陣列整體處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 錯誤 | 磁碟陣列整體處於無法復原狀態。 | 磁碟陣列已不再正常運作。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
磁碟陣列整體處於 NORMAL 狀態。 | No | 運作 | 資訊 | 磁碟陣列整體處於正常狀態。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
磁碟陣列整體處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定磁碟陣列的整體狀態。 | 系統無法擷取本機磁碟陣列的健全狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
外部存放裝置陣列處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 外部存放裝置陣列指示發生失敗 (廠商運作狀態:6 、16 )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 值:6-Error 、16-Supporting Entity Error 。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部存放裝置陣列處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 外部存放裝置陣列會報告非嚴重警告 (廠商運作狀態:3 、4 、5 、11 、14 、15 、17 )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 值:3-Degraded 、4-Stressed 、5-Predictive Failure 、11-In Service 、14-Aborted 、15-Dormant 、17-Completed Operation 。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部存放裝置陣列處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 錯誤 | 外部存放裝置陣列指示其已關閉且無法復原 (廠商運作狀態:7 )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部存放裝置陣列處於 NORMAL 狀態。 | No | 運作 | 資訊 | 外部存放裝置陣列正常運作中 (廠商狀態:ok )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 |
|
外部存放裝置陣列處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法根據廠商狀態判定外部存放裝置陣列的狀態 (廠商作業狀態:0 、1 、18 )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 值:0-Unkown 、1-Other 、18-Power Mode 。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部存放裝置陣列處於 UNREACHABLE 狀態。 | Yes | 失敗 | 錯誤 | 外部存放裝置陣列指示無法連線 (廠商運作狀態:8 、9 、10 、12 、13 )。 會在元件的 storage_global_status 屬性中報告廠商狀態。 值:8-Starting 、9-Stopping 、10-Stopped 、12-No Contact 、13-Lost Communication 。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部儲存體處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 外部儲存體指示發生失敗。 | 需要進行疑難排解。 如需詳細資料,請檢閱 Windows 事件記錄檔和存放裝置的事件記錄檔。 |
外部儲存體處於 DEGRADED 狀態。 | Yes | 已降級 | 警告 | 儲存體系統已降級。 您需要檢查此儲存體系統的溫度狀態或電源供應器狀態。 此外,如果移除儲存體系統的側邊面板,空氣流量變更可能會導致磁碟機冷卻不當,並影響溫度狀態。 會在元件的 storage_global_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
外部儲存體處於 NON-CRITICAL 狀態。 | 是,如果問題持續超過 7 小時,或經常在相同裝置上重複發生,超過每 90 天一次 | 已降級 | 警告 | 外部儲存體報告非嚴重警告。 | 此事件通常指示兩個問題之一:RAID 控制器電池供電快取模組上的磁碟故障/轉換事件或電池充電週期。 充電週期通常每隔 90 天排程一次,最多可能需要 7 小時。 在此期間,控制器的寫入快取原則可能會暫時從寫入變更成回寫。 這項變更可能會影響效能。 如需詳細資料,請檢閱 Windows 事件記錄檔和存放裝置的事件記錄檔。 |
外部儲存體處於 NORMAL 狀態。 | No | 運作 | 資訊 | 外部儲存體正常運作中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
外部儲存體處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定外部儲存體的狀態。 | 系統無法擷取伺服器外部儲存體的健全狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔和存放裝置的事件記錄檔。 |
風扇裝置處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | 風扇裝置已達到嚴重狀態上下閾值 (廠商狀態:CriticalUpper 或 CriticalLower )。 會在元件的 device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
風扇裝置處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 風扇裝置已達到非嚴重狀態上下閾值 (廠商狀態:nonCriticalUpper 或 nonCriticalLower )。 會在元件的 device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
風扇裝置處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 風扇裝置已達到無法復原狀態上下閾值 (廠商狀態:failed 、nonRecoverableUpper 或 nonRecoverableLower )。 會在元件的 device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
風扇裝置處於 NORMAL 狀態。 | No | 運作 | 資訊 | 風扇裝置正常執行中 (廠商狀態:ok )。 會在元件的 device_status 屬性中報告廠商狀態。 |
|
風扇裝置處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定風扇裝置的狀態 (廠商狀態:other 或 unknown )。 會在元件的 device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
光纖通道主機控制器處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | 光纖通道主機控制器元件偵測到下列其中一種狀況: – 主機控制器失敗且應更換 (廠商狀態: failed )。 – 主機控制器已關閉 (廠商狀態: shutdown )。 – 光纖通道連線失敗 (廠商狀態: loopFailed )。 會在元件的 FC_device_rollup_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 如果控制器狀態失敗,則更換控制器。 |
光纖通道主機控制器處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 光纖通道主機控制器將報告下列其中一種狀況: – 光纖通道聯機已降級 (廠商狀態: loopDegraded )。 – 光纖通道連接埠未連線,或其連線的裝置已關閉電源 (廠商狀態: notConnected )。 會在元件的 FC_device_rollup_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
光纖通道主機控制器處於 NORMAL 狀態。 | No | 運作 | 資訊 | 光纖通道主機控制器正常運作中 (廠商狀態:ok )。 會在元件的 FC_device_rollup_status 屬性中報告廠商狀態。 |
|
光纖通道主機控制器處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定光纖通道主機控制器狀態,或控制器不存在 (廠商狀態:other )。 會在元件的 FC_device_rollup_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
Hadoop 服務處於 CRITICAL 狀態。 | Yes | 非運作 | 錯誤 | 此服務處於嚴重狀態,並且已停止運作 (狀態:Installed 或 Stopped ) 或處於將停止的轉換狀態 (狀態:Stopping )。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
如需詳細資料,請檢閱節點的 Windows 與 PDW 元件事件記錄檔。 |
Hadoop 服務處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 此服務因下列其中一個原因而處於非嚴重狀態: – 服務正在啟動 (狀態: Starting )。 – 服務正在升級 (狀態: Upgrading )。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
如需詳細資料,請檢閱節點的 Windows 與 PDW 元件事件記錄檔。 |
Hadoop 服務處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 此服務將報告其處於未知狀態。 狀態會在元件的 hadoop_service_status 屬性中報告。 |
如需詳細資料,請檢閱節點的 Hadoop 記錄檔,以及 Windows 與 PDW 元件事件記錄檔。 |
記憶體裝置處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | 記憶體將報告嚴重問題。 | 可能需要更換 DIMM。 需要進行疑難排解。 伺服器可能仍然處於作用中狀態,並且有一些失敗的 RAM,但效能可能會受到影響。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
記憶體裝置處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 記憶體報告將非嚴重狀況。 | 此事件可能指向即將發生的 DIMM 失敗。 一般而言,這種情況表示 DIMM 已出現錯誤,但尚未超過閾值,使其處於嚴重/失敗狀態。 伺服器可能仍然處於作用中狀態,並且有一些失敗的 RAM,但效能可能會受到影響。 您必須清除硬體記錄檔,才能清除錯誤。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
記憶體裝置處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 記憶體報告了無法復原的問題。 | 可能需要更換 DIMM。 需要進行疑難排解。 伺服器可能仍然處於作用中狀態,並且有一些失敗的 RAM,但效能可能會受到影響。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
記憶體裝置處於 NORMAL 狀態。 | No | 運作 | 資訊 | 記憶體正常運作中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
記憶體裝置處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定記憶體的狀態。 | 系統無法擷取系統記憶體的健全狀態。 可能需要更換 DIMM。 需要進行疑難排解。 伺服器可能仍然處於作用中狀態,並且有一些失敗的 RAM,但效能可能會受到影響。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路轉接卡處於 CRITICAL 狀態。 | Yes | 已降級 | 警告 | 網路轉接卡因下列其中一個原因而引發重要警示: – 轉接卡已離線。 – 轉接卡已關閉電源。 – 轉接卡處於停止運作狀態。 |
網路轉接卡處於失敗狀態,可能需要更換 (這可能表示要更換主機板)。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路轉接卡處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 網路轉接卡正在指示有非嚴重警告,但仍可運作。 效能可能會降低。 | 網路轉接卡有一些錯誤,但並非處於嚴重狀態。 由於此狀態可能會影響效能,因此需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路轉接卡處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 由於網路轉接卡可能安裝錯誤,因此處於無法復原狀態。 | 網路轉接卡處於失敗狀態,可能需要更換 (這可能表示要更換主機板)。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路轉接卡處於 NORMAL 狀態。 | No | 運作 | 資訊 | 網路轉接卡已上線且正常執行中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
網路轉接卡處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 因下列其中一個原因而無法判定網路轉接卡的狀態: – 網路轉接卡處於省電模式:待命、低電量、警告、未知或電源週期。 – 尚未安裝網路轉接卡。 – 網路轉接卡裝置報告了未知狀態。 – 網路轉接卡處於測試狀態。 |
系統無法擷取網路轉接卡的健全狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路連線處於 CRITICAL 狀態。 | Yes | 已降級 | 警告 | 網路連線因下列其中一個原因而引發重要警示: – 網路已中斷連線。 – 硬體不存在。 – 已停用硬體。 – 媒體已中斷連線。 – 驗證失敗。 – 使用了無效的位址。 – 需要認證,但並未提供。 |
網路轉接卡處於嚴重狀態。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路連線處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 網路將報告非嚴重狀態。 可能出於下列其中一個原因而發生此狀態: – 網路處於正在連線狀態。 – 網路處於中斷連線狀態。 – 網路驗證正在進行中。 |
網路轉接卡處於非預期狀態。 如果此問題持續發生或多次發生,則需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
網路連線處於 NORMAL 狀態。 | No | 運作 | 資訊 | 網路已連線並正常運作中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
網路連線設定檔在預期設定檔上。 | No | 運作 | 資訊 | 網路已連線並如預期設定檔運作。 在元件的 profile_category 屬性中會報告設定檔。 網域設定檔為 2 ,而私人設定檔為 1 。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 |
網路連線設定檔會顯示在公用設定檔上。 | Yes | 已降級 | 警告 | 網路將報告其在公用設定檔上。 在元件的 profile_category 屬性中會報告設定檔。 公用設定檔報告為 0 。 此情況可能會導致此節點發生通訊問題。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
叢集中的節點處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 叢集節點已關閉。 | 叢集中的伺服器已關閉。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集中的節點處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 叢集節點正在擲回非嚴重警示。 可能會發生下列其中一種情況:節點處於暫停狀態,或節點正在加入叢集的流程中。 | 節點處於非預期狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
叢集中的節點處於 NORMAL 狀態。 | No | 運作 | 資訊 | 叢集節點已啟動並執行。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
叢集中的節點處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 叢集節點處於未知狀態。 | 系統無法擷取節點的健全狀態。 需要進行疑難排解。 檢閱 HST01 VM 上的容錯移轉叢集管理員。 |
實體磁碟處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 磁碟處於嚴重狀態 (廠商狀態:2-Unhealthy )。 在元件的 phys_disk_status 屬性中會報告狀態。 屬性 phys_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 運作狀態值:0 – 實體磁碟的運作狀態未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
|
實體磁碟處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 磁碟狀態指示存在非嚴重警告,但系統仍可運作。 在元件的 phys_disk_status 屬性中會報告狀態。 屬性 phys_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 運作狀態值:0 – 實體磁碟的運作狀態未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 |
實體磁碟處於 NORMAL 狀態。 | No | 運作 | 資訊 | 磁碟狀態處於正常狀態。 在元件的 phys_disk_status 屬性中會報告狀態。 |
|
實體磁碟處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定磁碟狀態 (狀態:5-Unknown )。 在元件的 phys_disk_status 屬性中會報告狀態。 屬性 phys_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 運作狀態值:0 – 實體磁碟的運作狀態未知。 2-OK 3-Degraded 4-Stressed 5-Predictive Failure 6-Error 7-Non-Recoverable Error 8-Starting 9-Stopping 10-Stopped 11-In Service 12-No Contact 13-Lost Communication 15-Dormant 18-Power Mode 0x8004-Failed Media 0x8005-Split 0x8006-Stale Metadata 0x8007-IO Error 0x8008-Corrupt Metadata |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 |
電源供應器處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | 電源供應器指示存在嚴重錯誤。 | 可能需要更換電源供應器。 需要進行疑難排解。 電源供應器為備援裝置,因此伺服器可能仍然處於作用中狀態。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
電源供應器處於 NON-CRITICAL 狀態。 | Yes | 運作 | 警告 | 電源供應器報告了非嚴重問題。 | 電源供應器已報告問題,但未處於失敗狀態。 此警示可能指示即將失敗。 電源供應器為備援裝置,因此失敗可能不會造成伺服器中斷。 可能需要清除硬體錯誤,才能清除管理員主控台錯誤。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
電源供應器處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 電源供應器處於無法復原狀態。 | 可能需要更換電源供應器。 需要進行疑難排解。 電源供應器為備援裝置,因此伺服器可能仍然處於作用中狀態。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
電源供應器處於 NORMAL 狀態。 | No | 運作 | 資訊 | 電源供應器正常執行中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
電源供應器處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定電源供應器的狀態。 | 系統無法擷取電源供應器的健全狀態。 電源供應器為備援裝置,因此伺服器可能仍然處於作用中狀態。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
處理器裝置處於 CRITICAL 狀態。 | Yes | 失敗 | 警告 | CPU 將報告嚴重問題。 | 可能需要更換 CPU。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
處理器裝置處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | CPU 將報告非嚴重狀況。 | CPU 發生錯誤,但尚未處於失敗狀態。 此警示可能指示即將失敗。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
處理器裝置處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | CPU 報告了無法復原的問題。 | 與嚴重狀態類似,可能需要更換 CPU。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
處理器裝置處於 NORMAL 狀態。 | No | 運作 | 資訊 | CPU 正常運作中。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
處理器裝置處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定 CPU 的狀態。 | 系統無法擷取 CPU 的健全狀態,並需要進一步調查。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
SAS 主機匯流排介面卡處於 DEGRADED 狀況。 | Yes | 已降級 | 警告 | SAS 主機匯流排介面卡將報告 HBA 及其控制的所有實體磁碟機的整體狀況已降級 (廠商狀態:degraded )。 會在元件的 hba_device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
SAS 主機匯流排介面卡處於 FAILED 狀況。 | Yes | 失敗 | 警告 | SAS 主機匯流排介面卡將報告 HBA 的整體狀況處於失敗狀態,包括其控制的所有實體磁碟機。 此狀況需要更換元件 (廠商狀態:failed )。 會在元件的 hba_device_rollup_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
SAS 主機匯流排介面卡處於 NORMAL 狀態。 | No | 運作 | 資訊 | SAS 主機匯流排介面卡正常運作中 (廠商狀態:ok )。 會在元件的 hba_device_rollup_status 屬性中報告廠商狀態。 |
|
SAS 主機匯流排介面卡處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判斷 SAS 主機匯流排介面卡狀態 (廠商狀態:other )。 會在元件的 hba_device_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
SQL Server 處於 CRITICAL 狀態。 | Yes | 非運作 | 錯誤 | 此服務處於嚴重狀態,並且已停止運作 (狀態:Stopped ) 或處於將停止的轉換狀態 (狀態:StopPending )。 狀態會在元件的 sql_server_service_status 屬性中報告。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
SQL Server 處於 NORMAL 狀態。 | No | 運作 | 資訊 | 此服務正常執行中 (狀態:Running )。 狀態會在元件的 sql_server_service_status 屬性中報告。 |
|
存放裝置機箱風扇處於 DEGRADED 狀態。 | Yes | 已降級 | 警告 | 存放裝置機箱風扇將報告其已降級 (廠商狀態:10 、15 )。 會在元件的 storage_fan_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱風扇處於 FAILED 狀態。 | Yes | 失敗 | 警告 | 存放裝置機箱風扇將報告其處於失敗狀態。 此狀態需要更換元件 (廠商狀態:20 、25 )。 會在元件的 storage_fan_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱風扇處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 存放裝置機箱風扇將報告其處於無法復原狀態。 此警示需要更換元件 (廠商狀態:30 )。 會在元件的 storage_fan_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱風扇處於 UNKOWN 狀態。 | Yes | 已降級 | 錯誤 | 無法判定存放裝置機箱風扇的狀態 (廠商狀態:0-Unknown )。 會在元件的 storage_fan_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱風扇處於 NORMAL 狀態。 | No | 運作 | 資訊 | 存放裝置機箱風扇正常運作中 (廠商狀態:5 )。 會在元件的 storage_fan_status 屬性中報告廠商狀態。 |
|
存放裝置機箱電源供應器處於 DEGRADED 狀態。 | Yes | 已降級 | 警告 | 存放裝置機箱電源供應器將報告其已降級 (廠商狀態:10 、15 )。 會在元件的 storage_power_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱電源供應器處於 FAILED 狀態。 | Yes | 失敗 | 錯誤 | 存放裝置機箱電源供應器將報告其處於失敗狀態。 此狀態需要更換元件,或將電源還原至裝置 (廠商狀態:20 、25 )。 會在元件的 storage_power_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱電源供應器處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 錯誤 | 存放裝置機箱電源供應器將報告其處於無法復原狀態。 此狀況需要更換元件 (廠商狀態:30 )。 會在元件的 storage_power_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱電源供應器處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定存放裝置機箱電源供應器的狀態 (廠商狀態:0 )。 會在元件的 storage_power_status 屬性中報告廠商狀態。 |
如需詳細資料,請檢閱節點的 Windows 事件記錄檔,或連絡裝置製造商。 |
存放裝置機箱電源供應器處於 NORMAL 狀態。 | No | 運作 | 資訊 | 存放裝置機箱電源供應器正常運作中 (廠商狀態:5 )。 會在元件的 storage_power_status 屬性中報告廠商狀態。 |
|
儲存集區處於 CRITICAL 狀態。 | Yes | 失敗 | 儲存集區處於嚴重狀態 (廠商狀態:2-Unhealthy )。 在元件的 storage_pool_status 屬性中會報告狀態。 屬性 storage_pool_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 | |
儲存集區處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 儲存集區狀態指示存在非嚴重警告,但系統仍可運作 (狀態︰1-Warning )。 在元件的 storage_pool_status 屬性中會報告狀態。 屬性 storage_pool_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 | |
儲存集區處於 NORMAL 狀態。 | No | 運作 | 儲存集區處於正常狀態 (狀態:0-Healthy )。 在元件的 storage_pool_status 屬性中會報告狀態。 |
||
儲存集區處於 UNKNOWN 狀態。 | 選擇性 | 運作 | 儲存集區狀態在此節點上處於未知狀態 (狀態:5-Unknown )。 在元件的 storage_pool_status 屬性中會報告狀態。 屬性 storage_pool_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 當查詢儲存集區狀態的節點並非儲存集區的擁有者時,通常會發生此問題。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 | |
溫度處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 溫度已達到嚴重狀態上下閾值。 | 溫度過高或過低。 持續此狀態可能會損壞硬體或大幅縮短硬體的壽命。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
溫度處於 NON-CRITICAL 狀態。 | 選擇性 | 已降級 | 警告 | 溫度已達到非嚴重狀態上下閾值。 | 伺服器報告的溫度在高於或低於正常層級,但尚未達到嚴重狀態的閾值。 溫度超出閾值會縮短硬體壽命。 可能會影響溫度的因素包括工作負載、資料中心溫度/氣流,以及限制伺服器耗盡的纜線。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
溫度處於 NON-RECOVERABLE 狀態。 | Yes | 失敗 | 警告 | 溫度處於無法復原狀態。 | 溫度感應器偵測到無法復原的錯誤。 此問題可能是溫度或是溫度模組本身的問題。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
溫度處於 NORMAL 狀態。 | No | 運作 | 資訊 | 溫度處於正常狀態。 | 元件之前報告不同的狀態,但此後已恢復正常。 |
溫度處於 UNKNOWN 狀態。 | Yes | 已降級 | 警告 | 無法判定溫度的狀態。 | 系統無法擷取伺服器溫度。 需要進行疑難排解。 如需詳細資料,請檢閱節點的 Windows 事件記錄檔。 |
虛擬磁碟處於 CRITICAL 狀態。 | Yes | 失敗 | 錯誤 | 儲存空間虛擬磁碟處於嚴重狀態 (廠商狀態:2-Unhealthy )。 在元件的 virtual_disk_status 屬性中會報告狀態。 屬性 virtual_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 |
虛擬磁碟處於 NON-CRITICAL 狀態。 | Yes | 已降級 | 警告 | 儲存空間虛擬磁碟狀態指示存在非嚴重警告,但系統仍可運作 (狀態:1-Warning )。 在元件的 virtual_disk_status 屬性中會報告狀態。 屬性 virtual_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 如果虛擬磁碟已移至另一個節點,請檢閱叢集共用磁碟區元件的狀態,並且將磁碟移回預期擁有者。 名稱中 N 後面的數字指示預期擁有者。 例如,N01D01 屬於 HSA01。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 遺失單一磁碟可能會影響鏡像的健康情況,因此磁碟本身可能會發生另一個警示。 |
虛擬磁碟處於 NORMAL 狀態。 | No | 運作 | 資訊 | 儲存空間虛擬磁碟處於正常狀態 (狀態:0-Healthy )。 在元件的 virtual_disk_status 屬性中會報告狀態。 |
|
虛擬磁碟處於 UNKNOWN 狀態。 | Yes | 運作 | 警告 | 無法判定儲存空間虛擬磁碟狀態 (狀態:5-Unknown )。 在元件的 virtual_disk_status 屬性中會報告狀態。 屬性 virtual_disk_oper_status 中顯示的運作狀態可能會提供更多關於問題的資訊。 如果虛擬磁碟已移至另一個節點,請檢閱叢集共用磁碟區元件的狀態,並且將磁碟移回預期擁有者。 名稱中 N 後面的數字指示預期擁有者。 例如,N01D01 屬於 HSA01。 |
如需進一步的詳細資料,請檢閱記錄 Application and service logs\Microsoft\Windows\StorageSpaces-Driver\Operational 中的節點事件。 |
磁碟區可用空間處於 CRITICAL 狀態。 | Yes | 已降級 | 錯誤 | 磁碟區可用空間處於嚴重偏低狀態。 目前磁碟區的已使用磁碟空間超過總容量的 90%。 清除不必要的檔案/資料,以確保正常設備操作。 | 管理員主控台會報告已配置的空間,但不一定是已使用空間。 您可以使用 DBCC PDW_SHOWSPACEUSED 來調查已使用空間與已配置空間。 您也可以使用 DBCC SHRINKLOG。 另外還有 DMV,可為資料表大小提供更多可自訂的查詢。 如需詳細資訊,請參閱資料表大小查詢。 |
磁碟區可用空間處於 NON-CRITICAL 狀態。 | 選擇性 | 運作 | 警告 | 目前磁碟區的已使用磁碟空間介於已使用 70% 與 90% 之間狀態。 檢閱此磁碟區使用的磁碟空間,並清除不必要的檔案/資料,以確保正常設備操作。 | 管理員主控台會報告已配置的空間,但不一定是已使用空間。 您可以使用 DBCC PDW_SHOWSPACEUSED 來調查已使用空間與已配置空間。 您也可以使用 DBCC SHRINKLOG。 另外還有 DMV,可為資料表大小提供更多可自訂的查詢。 如需詳細資訊,請參閱資料表大小查詢。 |
磁碟區可用空間處於 NORMAL 狀態。 | No | 運作 | 資訊 | 此磁碟區上有足夠的可用磁碟空間。 目前磁碟區的已使用磁碟空間低於 70%。 | 元件之前報告不同的狀態,但此後已恢復正常。 若要識別資料表取用的空間和資料列,請參閱資料表大小查詢。 |