使用 健全狀況服務 監視叢集
適用於:Azure 本機版本 23H2 和 22H2;Windows Server 2022、Windows Server 2019、Windows Server 2016
健全狀況服務 會先在 Windows Server 2016 中發行,可改善執行 儲存空間直接存取 之叢集的日常監視和操作體驗。
必要條件
根據預設,「健全狀況服務」會隨「儲存空間直接存取」一起啟用。 不需要其他動作來設定或啟動它。 若要深入瞭解 儲存空間直接存取,請參閱 儲存空間直接存取 概觀。
叢集效能歷程記錄
從您的 儲存空間直接存取 叢集取得即時效能和容量資訊。 請參閱 取得叢集效能歷程記錄。
健全狀況服務錯誤
顯示任何目前的錯誤,以輕鬆驗證部署的健康情況。 請參閱檢視 健全狀況服務 錯誤。
健全狀況服務 動作
追蹤 健全狀況服務 動作的進度。 請參閱追蹤 健全狀況服務 動作。
自動化
本節說明「健全狀況服務」在磁碟生命週期內自動執行的工作流程。
磁碟生命週期
「健全狀況服務」會自動執行實體磁碟生命週期的大部分階段。 假設您部署的初始階段健康情況都良好,也就表示說所有實體磁碟都正常運作。
淘汰
當實體磁碟已無法再使用時,系統便會將它們淘汰,並且會引發相對應的「錯誤」。 有幾種情況:
- 媒體故障:實體磁碟確實已故障或損壞,因此必須更換。
- 遺失通訊:實體磁碟已經超過 15 分鐘失去連線。
- 沒有回應:實體磁碟在一小時內發生三次以上超過 5.0 秒的延遲。
注意
如果同時失去對多個實體磁碟 (或整個節點或存放裝置機箱) 的連線,健全狀況服務「不會」淘汰這些磁碟,因為它們是根本問題的可能性較低。
如果被淘汰的磁碟曾作為其他多個實體磁碟的快取,且有其他可用的快取磁碟,系統將會自動重新指派一個給它們。 使用者不需要採取特別的動作。
還原復原能力
實體磁碟一旦被淘汰,「健全狀況服務」會立即開始將其資料複製到其餘的實體磁碟,以還原完整復原能力。 一旦完成,資料便完全安全,容錯也重新開始。
注意
此立即還原需要其餘的實體磁碟有足夠的可用空間。
讓指示燈閃爍
可能的話,「健全狀況服務」會讓已淘汰的實體磁碟或其插槽上的指示燈開始閃爍。 指示燈會無限期持續閃爍,直到更換淘汰的磁碟。
注意
某些情況下,磁碟故障的方式可能使其指示燈也無法運作 - 例如,完全失去電源。
實體磁碟更換
若情況允許,您應該更換淘汰的實體磁碟。 這通常由熱交換所組成,也就是不需要關閉節點或存儲設備機箱的電源。 請參閱「錯誤」以取得很有用的位置和組件資訊。
驗證
插入取代磁碟時,將會根據支援的元件文件進行驗證(請參閱下一節)。
Pooling
若情況允許,取代用磁碟會自動取代到其前身的集區中以開始使用。 此時,系統會回到其良好健康情況的初始狀態,然後「錯誤」會消失。
支援的元件檔
健全狀況服務 提供強制機制,將 儲存空間直接存取 所使用的元件限製為系統管理員或解決方案廠商所提供支援元件檔上的元件。 這可以防止您或其他人誤用不支援的硬體,這有助於符合保固或支援合約的規定。 此功能目前僅限於實體磁碟裝置,包括 SSD、HDD 和 NVMe 磁碟驅動器。 支援的元件檔可以限制型號、製造商(選用)和韌體版本(選擇性)。
使用方式
支援的元件檔使用 XML 啟發語法。 建議您使用您慣用的文本編輯器,例如免費的 Visual Studio Code 或記事本,建立您可以儲存和重複使用的 XML 檔。
區段
檔案有兩個獨立的區段: Disks
和 Cache
。
如果提供 區 Disks
段,則只允許加入集區列出的磁碟驅動器(如 Disk
所示)。 任何未列出的磁碟驅動器都無法聯結集區,從而有效地排除其在生產環境中的使用。 如果此區段保留空白,則會允許任何磁碟驅動器加入集區。
如果提供 區 Cache
段,則只會使用列出的磁碟驅動器 (as CacheDisk
) 來快取。 如果本節保留空白,儲存空間直接存取 嘗試根據媒體類型和總線類型進行猜測。 此處列出的磁碟驅動器也應該列在 中 Disks
。
重要
支援的元件檔不會追溯到已集區及使用中的磁碟驅動器。
範例
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
若要列出多個磁碟驅動器,只需新增其他 <Disk>
或 <CacheDisk>
標籤即可。
若要在部署 儲存空間直接存取 時插入此 XML,請使用 -XML
參數:
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
在部署 儲存空間直接存取 之後,若要設定或修改支援的元件檔:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
注意
型號、製造商,和韌體版本屬性應與您使用 Get-PhysicalDisk Cmdlet 所取得的值完全相符。 視您廠商的實作而定,這可能會與您一般預期的有所不同。 例如,製造商可能是 "CONTOSO-LTD",而,不是 "Contoso",或者當型號是 "Contoso-XZY9000" 時,製造商可能會是空白。
您可以使用以下 PowerShell Cmdlet 來驗證:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
健全狀況服務 設定
修改 健全狀況服務 設定,以調整錯誤或動作的積極性、開啟或關閉特定行為等等。 請參閱修改 健全狀況服務 設定。
其他參考
- 取得叢集效能歷程記錄
- 檢視健全狀況服務錯誤
- 追蹤 健全狀況服務 動作
- 儲存空間直接存取概觀 \(部分機器翻譯\)