共用方式為


使用 健康服務 監控叢集

適用於:Azure Local 2311.2 和更新版本;Windows Server 2022、Windows Server 2019、Windows Server 2016

健康服務首次在 Windows Server 2016 中發佈,改善了運行 Storage Spaces Direct 的叢集的日常監視和操作體驗。

必要條件

根據預設,「健康服務」會隨「儲存空間直接存取」一起啟用。 不需要其他動作來設定或啟動它。 若要深入瞭解 儲存空間直接存取,請參閱 儲存空間直接存取 概觀

叢集效能歷程記錄

從您的 儲存空間直接存取 叢集取得即時效能和容量資訊。 請參閱 取得叢集效能歷程記錄

健康服務問題

顯示任何目前的錯誤,以輕鬆驗證部署的健康狀況。 請參閱檢視 健康服務錯誤

健康服務措施

追蹤健康狀況服務自動執行動作的進度。 請參閱追蹤健康服務操作

自動化

本節說明磁碟生命週期中由「健康服務」自動化的工作流程。

磁碟生命週期

健康服務會自動化管理實體磁碟生命週期的大部分階段。 假設您部署的初始階段健康情況都良好,也就表示說所有實體磁碟都正常運作。

退休

當實體磁碟已無法再使用時,系統便會將它們淘汰,並且會引發相對應的「錯誤」。 有幾種情況:

  • 媒體故障:實體磁碟確實已故障或損壞,因此必須更換。
  • 遺失通訊:實體磁碟已經超過 15 分鐘失去連線。
  • 沒有回應:實體磁碟在一小時內發生三次以上超過 5.0 秒的延遲。

注意

如果同時失去對多個實體磁碟 (或整個節點或存放裝置機箱) 的連線,健全狀況服務「不會」淘汰這些磁碟,因為它們是根本問題的可能性較低。

如果被淘汰的磁碟曾作為其他多個實體磁碟的快取,且有其他可用的快取磁碟,系統將會自動重新指派一個給它們。 使用者不需要採取特別的動作。

恢復韌性

一旦實體磁碟被淘汰,健康服務會立即開始將其資料複製到剩餘的實體磁碟上,以恢復完整的復原力。 一旦完成,資料便完全安全,而且容錯能力已恢復。

注意

此立即還原需要其餘的實體磁碟有足夠的可用空間。

讓指示燈閃爍

如果可能的話,健康服務會讓退役的實體磁碟或其插槽上的指示燈開始閃爍。 指示燈會無限期持續閃爍,直到更換淘汰的磁碟。

注意

某些情況下,磁碟故障的方式可能使其指示燈也無法運作 - 例如,完全失去電源。

實體磁碟更換

若情況允許,您應該更換淘汰的實體磁碟。 這通常涉及熱插拔,也就是不需要關閉節點或存儲機箱的電源。 請參閱「錯誤」以取得很有用的位置和組件資訊。

驗證

插入取代磁碟時,將會根據支援的元件文件進行驗證(請參閱下一節)。

資源整合

若允許,替換磁碟會自動置入其先前磁碟的資源池中以開始使用。 此時,系統會回到其良好健康情況的初始狀態,然後「錯誤」會消失。

支援的元件文件

健康服務提供執行機制,將 Storage Spaces Direct 所使用的元件限制為由系統管理員或解決方案提供商提供的支援元件文件中的元件。 這可以防止您或其他人誤用不支援的硬體,這有助於符合保固或支援合約的規定。 此功能目前僅限於實體磁碟裝置,包括 SSD、HDD 和 NVMe 磁碟驅動器。 支援的元件檔可以限制型號、製造商(選用)和韌體版本(選擇性)。

使用方式

支援的元件檔使用 XML 啟發語法。 建議您使用您慣用的文本編輯器,例如免費的 Visual Studio Code 或記事本,建立您可以儲存和重複使用的 XML 檔。

區段

檔案有兩個獨立的區段: DisksCache

如果提供 區 Disks 段,則只允許加入集區列出的磁碟驅動器(如 Disk所示)。 任何未列出的磁碟驅動器都無法加入集區,有效地防止它們在生產環境中的使用。 如果此區段保留空白,則會允許任何磁碟驅動器加入集區。

如果提供 Cache 區段,則只會使用列出的磁碟驅動器(如 CacheDisk)來快取。 如果此部分留空,Storage Spaces Direct 會嘗試根據媒體類型和總線類型來進行猜測。 此處列出的磁碟驅動器也應該列在 Disks 中。

重要

支援的元件文件不適用於已集區及使用中的磁碟驅動器。

範例

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

若要列出多個磁碟驅動器,只需新增其他 <Disk><CacheDisk> 標籤即可。

若要在部署 儲存空間直接存取 時插入此 XML,請使用 -XML 參數:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

在部署 儲存空間直接存取 之後,若要設定或修改支援的元件檔:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

注意

型號、製造商,和韌體版本屬性應與您使用 Get-PhysicalDisk Cmdlet 所取得的值完全相符。 視您廠商的實作而定,這可能會與您一般預期的有所不同。 例如,製造商可能是 "Contoso",而不是 "CONTOSO-LTD",或者當型號是 "Contoso-XZY9000" 時,製造商可能是空白的。

您可以使用以下 PowerShell Cmdlet 來驗證:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

健康服務設置

修改 健全狀況服務 設定,以調整錯誤或動作的積極性、開啟或關閉特定行為等等。 請參閱修改 健全狀況服務 設定

其他參考