Monitorování clusterů pomocí služby Health Service
Platí pro: Azure Local 2311.2 a novější; Windows Server 2022, Windows Server 2019, Windows Server 2016
Služba Health Service, která byla poprvé vydána ve Windows Server 2016, vylepšuje každodenní monitorování a provozní zkušenosti pro clustery se spuštěnými Storage Spaces Direct.
Požadavky
Služba Health Service je ve výchozím nastavení zapnuta pro Storage Spaces Direct. Její nastavení a spuštění nevyžaduje žádné další akce. Další informace o technologii Storage Spaces Direct najdete v přehledu Storage Spaces Direct.
Historie výkonu clusteru
Získejte informace o aktuálním výkonu a kapacitě z clusteru Storage Spaces Direct. Viz Získání historie výkonu clusteru.
Chyby zdravotnické služby
Zobrazte všechny aktuální chyby, abyste mohli snadno ověřit stav nasazení. Viz Zobrazení chyb služby Health Service.
Akce zdravotní služby
Sledujte průběh akcí služby Health Service, které se provádějí samostatně. Viz Sledování akcí služby Health Service.
Automatizace
V této části jsou popsané pracovní postupy automatizované službou Health Service během životního cyklu disku.
Životní cyklus disku
Služba Health Service automatizuje většinu fází životního cyklu disku. Řekněme, že počáteční stav vašeho nasazení je v dokonalém pořádku, což znamená, že všechny fyzické disky fungují správně.
Důchod
Fyzické disky, které se nedají použít, se automaticky vyřadí. Tím vznikne odpovídající chyba. Existuje několik případů:
- Selhání média: fyzický disk definitivně selhal nebo se poškodil a musí být nahrazen.
- Ztráta komunikace: fyzický disk ztratil připojení na více než 15 po sobě jdoucích minut.
- Neodpovídá: fyzický disk jeví známky latence, která je delší než 5 sekund a projeví se třikrát nebo vícekrát za hodinu.
Poznámka:
Pokud ke ztrátě připojení došlo u více fyzických disků najednou, u celého uzlu nebo u skříně úložiště, služba Health Service tyto disky nevyřadí, protože pravděpodobně nejsou hlavní příčinou problému.
Pokud vyřazený disk sloužil jako mezipaměť řadě jiných fyzických disků, bude těmto diskům přiřazen automaticky jiný disk s mezipamětí, pokud je k dispozici. Žádný zvláštní zásah uživatele není potřeba.
Obnovení odolnosti
Jakmile je fyzický disk vyřazený, začne služba Health Service ihned kopírovat data na zbývající fyzické disky, aby obnovila plnou odolnost. Po dokončení kopírování jsou data znovu v bezpečí a chráněná proti poruše.
Poznámka:
Okamžité obnovení ale vyžaduje dostatečnou kapacitu na zbývajících fyzických discích.
Blikající indikátor
Pokud je to možné, spustí služba Health Service blikání indikátoru u vyřazeného fyzického disku nebo slotu. Toto bude pokračovat neomezeně, dokud nedojde k výměně vyřazeného disku.
Poznámka:
Někdy se může disk porouchat takovým způsobem, že nefunguje ani jeho indikátor – například při úplném výpadku napájení.
Fyzická výměna
Vyřazený fyzický disk byste měli vyměnit, jakmile to bude možné. Nejčastěji se jedná o výměnu za chodu – tj. není nutné vypínat uzel nebo skříň úložiště. Viz katalog Chyby pro užitečné informace o umístění a součástech.
Ověření
Po vložení náhradního disku se ověří v dokumentu s podporovanými komponentami (viz další část).
Sdružování
Pokud je to dovoleno, náhradní disk automaticky nahradí předchozí disk ve fondu a začne se používat. V tomto okamžiku se systém vrátí do původního bezchybného stavu a chyba zmizí.
Dokument podporovaných komponent
Zdravotní služba poskytuje mechanismus vynucení, který omezuje komponenty používané službou Storage Spaces Direct na součásti v dokumentu podporovaných komponent, který poskytuje správce nebo dodavatel řešení. Seznam slouží k tomu, abyste vy ani jiní uživatelé nemohli omylem použít nepodporovaný hardware. Uvedený postup může být potřeba například kvůli záruce nebo dodržení podmínek smlouvy o podpoře. Tato funkce je aktuálně omezena na fyzická disková zařízení, včetně disků SSD, PEVNÝch disků a jednotek NVMe. Dokument podporovaných komponent může omezit na model, výrobce (volitelné) a verzi firmwaru (volitelné).
Využití
Dokument podporovaných komponent používá syntaxi inspirovanou jazykem XML. K vytvoření dokumentu XML, který můžete uložit a znovu použít, doporučujeme použít oblíbený textový editor, jako je bezplatný editor Visual Studio Code nebo Poznámkový blok.
Oddíly
Dokument má dvě nezávislé oddíly: Disks
a Cache
.
Pokud je oddíl uvedený, smějí se k bazénům připojit jenom jednotky uvedené (jako Disk
). Nezařazeným jednotkám je zabráněno v připojení k fondům, což účinně znemožňuje jejich použití v produkčním prostředí. Pokud je tato sekce prázdná, bude mít každá jednotka povoleno připojení k fondům.
Pokud je uveden oddíl Cache
, používají se k ukládání do mezipaměti pouze jednotky uvedené jako CacheDisk
. Pokud je tato část prázdná, Storage Spaces Direct se pokusí odhadnout na základě typu média a typu sběrnice. Jednotky uvedené zde by měly být uvedeny také v Disks
.
Důležité
Dokument podporovaných komponent se nevztahuje zpětně na disky, které jsou již seskupené a používají se.
Příklad
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Pokud chcete zobrazit seznam více jednotek, stačí přidat další <Disk>
nebo <CacheDisk>
tagy.
Pokud chcete při nasazování Prostory úložiště s přímým přístupem vložit tento kód XML, použijte -XML
parametr:
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Nastavit nebo upravit dokument podporovaných součástí po nasazení Storage Spaces Direct:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Poznámka:
Vlastnosti, jako je model, výrobce a verze firmwaru, musí přesně odpovídat hodnotám, které získáte rutinou Get-PhysicalDisk. Hodnoty se mohou lišit od těch, které byste normálně čekali, protože záleží na jejich implementaci dodavatelem. Například výrobce nemusí být „Contoso“, ale „CONTOSO-LTD“, nebo může být nevyplněný, zatímco model může být „Contoso-XZY9000“.
K ověření použijte následující příkaz prostředí PowerShell:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
Nastavení služby Health Service
Upravte nastavení služby Health Service, abyste vyladili agresivitu chyb nebo akcí, zapnuli nebo vypnuli určité chování a další. Viz Úprava nastavení služby Health Service.