Monitorování clusterů pomocí služby Health Service
Platí pro: Azure Local, verze 23H2 a 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Služba Health Service, která byla poprvé vydána ve Windows Serveru 2016, vylepšuje každodenní monitorování a provozní prostředí pro clustery se spuštěnými Prostory úložiště s přímým přístupem.
Požadavky
Služba Health Service je automaticky zapnutá pro prostory úložiště s přímým přístupem. Její nastavení a spuštění nevyžaduje žádné další akce. Další informace o Prostory úložiště s přímým přístupem najdete v přehledu Prostory úložiště s přímým přístupem.
Historie výkonu clusteru
Získejte informace o živém výkonu a kapacitě z clusteru Prostory úložiště s přímým přístupem. Viz Získání historie výkonu clusteru.
Chyby služby Health Service
Zobrazte všechny aktuální chyby, abyste mohli snadno ověřit stav nasazení. Viz Zobrazení chyb služby Health Service.
Akce služby Health Service
Sledujte průběh akcí služby Health Service, které se provádějí samostatně. Viz Sledování akcí služby Health Service.
Automation
V této části jsou popsané pracovní postupy automatizované službou Health Service během životního cyklu disku.
Životní cyklus disku
Služba Health Service automatizuje většinu fází životního cyklu disku. Předpokládejme, že na začátku jsou nasazené disky v perfektním stavu, tzn. že všechny fyzické disky pracují správně.
Vyřazení
Fyzické disky, které se nedají použít, se automaticky vyřadí. Tím vznikne odpovídající chyba. Možné příčiny chyby:
- Selhání média: fyzický disk definitivně selhal nebo se poškodil a musí být nahrazen.
- Ztráta komunikace: fyzický disk ztratil připojení na více než 15 po sobě jdoucích minut.
- Neodpovídá: fyzický disk jeví známky latence, která je delší než 5 sekund a projeví se třikrát nebo vícekrát za hodinu.
Poznámka:
Pokud ke ztrátě připojení došlo u více fyzických disků najednou, u celého uzlu nebo u skříně úložiště, služba Health Service tyto disky nevyřadí, protože pravděpodobně nejsou hlavní příčinou problému.
Pokud vyřazený disk sloužil jako mezipaměť řadě jiných fyzických disků, bude těmto diskům přiřazen automaticky jiný disk s mezipamětí, pokud je k dispozici. Žádný zvláštní zásah uživatele není potřeba.
Obnovení odolnosti
Jakmile je fyzický disk vyřazený, začne služba Health Service ihned kopírovat data na zbývající fyzické disky, aby obnovila plnou odolnost. Po dokončení kopírování jsou data znovu v bezpečí a chráněná proti poruše.
Poznámka:
Okamžité obnovení ale vyžaduje dostatečnou kapacitu na zbývajících fyzických discích.
Blikající indikátor
Pokud je to možné, spustí služba Health Service blikání indikátoru u vyřazeného fyzického disku nebo slotu. Blikání bude pokračovat, dokud nedojde k výměně vyřazeného disku.
Poznámka:
Někdy se může disk porouchat takovým způsobem, že nefunguje ani jeho indikátor – například při úplném výpadku napájení.
Fyzická výměna
Vyřazený fyzický disk byste měli vyměnit, jakmile to bude možné. Nejčastěji se to skládá z horkého prohození – tj. vypnutí uzlu nebo skříně úložiště se nevyžaduje. Užitečné informace o umístění vadného dílu jsou součástí chyby.
Ověření
Po vložení náhradního disku se ověří v dokumentu s podporovanými komponentami (viz další část).
Sdružování
Pokud je to dovoleno, náhradní disk automaticky nahradí předchozí disk ve fondu a začne se používat. V tomto okamžiku se systém vrátí do původního bezchybného stavu a chyba zmizí.
Dokument podporovaných komponent
Služba Health Service poskytuje mechanismus vynucení, který omezuje komponenty používané Prostory úložiště s přímým přístupem na součásti v dokumentu podporovaných komponent poskytovaných správcem nebo dodavatelem řešení. Seznam slouží k tomu, abyste vy ani jiní uživatelé nemohli omylem použít nepodporovaný hardware. Uvedený postup může být potřeba například kvůli záruce nebo dodržení podmínek smlouvy o podpoře. Tato funkce je aktuálně omezena na fyzická disková zařízení, včetně disků SSD, PEVNÝch disků a jednotek NVMe. Dokument podporovaných komponent může omezit na model, výrobce (volitelné) a verzi firmwaru (volitelné).
Využití
Dokument podporovaných komponent používá syntaxi inspirovanou jazykem XML. K vytvoření dokumentu XML, který můžete uložit a znovu použít, doporučujeme použít oblíbený textový editor, jako je bezplatný editor Visual Studio Code nebo Poznámkový blok.
Oddíly
Dokument má dvě nezávislé oddíly: Disks
a Cache
.
Disks
Pokud je oddíl uvedený, můžou se fondy připojit jenom jednotky uvedené (jakoDisk
). Všem nesděleným jednotkám se zabrání spojení fondů, což účinně brání jejich použití v produkčním prostředí. Pokud je tento oddíl prázdný, budou mít všechny jednotky povolené připojení k fondům.
Cache
Pokud je oddíl uvedený, používají se k ukládání do mezipaměti pouze jednotky uvedené (jakoCacheDisk
). Pokud je tento oddíl prázdný, Prostory úložiště s přímým přístupem se pokusí odhadnout na základě typu média a typu sběrnice. Zde uvedené jednotky by měly být uvedeny také v Disks
.
Důležité
Dokument podporovaných komponent se nevztahuje zpětně na jednotky, které jsou již ve fondu a které se používají.
Příklad
<Components>
<Disks>
<Disk>
<Manufacturer>Contoso</Manufacturer>
<Model>XYZ9000</Model>
<AllowedFirmware>
<Version>2.0</Version>
<Version>2.1</Version>
<Version>2.2</Version>
</AllowedFirmware>
<TargetFirmware>
<Version>2.1</Version>
<BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
</TargetFirmware>
</Disk>
<Disk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</Disk>
</Disks>
<Cache>
<CacheDisk>
<Manufacturer>Fabrikam</Manufacturer>
<Model>QRSTUV</Model>
</CacheDisk>
</Cache>
</Components>
Pokud chcete zobrazit seznam více jednotek, stačí přidat další <Disk>
nebo <CacheDisk>
značky.
Pokud chcete při nasazování Prostory úložiště s přímým přístupem vložit tento kód XML, použijte -XML
parametr:
$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML
Nastavení nebo úprava dokumentu podporovaných součástí po nasazení Prostory úložiště s přímým přístupem:
$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML
Poznámka:
Vlastnosti, jako je model, výrobce a verze firmwaru, musí přesně odpovídat hodnotám, které získáte rutinou Get-PhysicalDisk. Hodnoty se mohou lišit od těch, které byste normálně čekali, protože záleží na jejich implementaci dodavatelem. Například výrobce nemusí být „Contoso“, ale „CONTOSO-LTD“ nebo může být tato vlastnost prázdná, ale model může být „Contoso-XZY9000“.
K ověření použijte následující rutinu prostředí PowerShell:
Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion
Nastavení služby Health Service
Upravte nastavení služby Health Service, abyste vyladili agresivitu chyb nebo akcí, zapnuli nebo vypnuli určité chování a další. Viz Úprava nastavení služby Health Service.