Vysvětlení a monitorování opětovné synchronizace úložiště
Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019
Upozornění na opětovnou synchronizaci úložiště je funkce Storage Spaces Direct v Azure Stack HCI a Windows Serveru. Služba Health Service umožňuje vyvolat chybu, která vás upozorní na opětovnou synchronizaci. To vám pomůže zabránit nechtěnému odstavení dalších serverů, což by mohlo mít vliv na několik domén selhání a vést k výpadku clusteru.
Tento článek poskytuje přehled o opětovné synchronizaci úložiště a o tom, jak ji můžete sledovat v clusteru pro převzetí služeb při selhání s technologií Storage Spaces Direct.
Informace o opětovné synchronizaci úložiště
Začněme jednoduchým příkladem, abychom pochopili, jak se úložiště může dostat ze synchronizace. Mějte na paměti, že toto chování vykazuje jakékoli řešení distribuovaného úložiště typu shared-nothing (pouze místní jednotky). Následující část ukazuje, jak se úložiště přestane synchronizovat, když dojde k výpadku jednoho uzlu serveru. Jeho disky se neaktualizují, dokud se nevrátí online – toto chování se vztahuje na jakoukoli hyperkonvergovanou architekturu.
Předpokládejme, že chcete uložit řetězec "HELLO".
Za předpokladu, že máte třícestnou odolnost zrcadla, máte tři kopie tohoto řetězce. Pokud server č. 1 dočasně vypnete (kvůli údržbě), nebudete mít přístup ke kopii #1.
Předpokládejme, že v tuto chvíli aktualizujete řetězec z "HELLO" na "HELP!".
Po aktualizaci řetězce se úspěšně aktualizují kopie #2 a #3. K kopii č. 1 se ale nedá získat přístup, protože server č. 1 je dočasně vypnutý (kvůli údržbě).
Teď máte kopii č. 1 s nesynchronnými daty. Operační systém používá podrobné sledování nezašpiněných oblastí k udržení přehledu bitů, které nejsou synchronizované. Tímto způsobem, když se server č. 1 vrátí do online režimu, můžete změny synchronizovat tak, že načtete data z kopie č. 2 nebo #3 a přepíšete data v kopii č. 1. Pomocí tohoto přístupu je potřeba kopírovat pouze tato data, která jsou zastaralá, místo opětovné synchronizace všech dat ze serveru č. 2 nebo serveru č. 3.
Předchozí část popsala, jak se data mohou dostat mimo synchronizaci. Jak to ale vypadá na vyšší úrovni? Předpokládejme, že máte tříserverový hyperkonvergovaný cluster. Když je server č. 1 v údržbě, uvidíte, že je vypnutý. Při zálohování serveru #1 začne znovu synchronizovat všechna jeho úložiště pomocí podrobného sledování nezašpiněných oblastí (vysvětleno v předchozí části). Jakmile se data znovu synchronizují, zobrazí se všechny servery jako v pořádku.
Následující obrázek GIF ukazuje, jak funguje resynchronizace úložiště v hyperkonvergovaném clusteru:
Monitorování resynchronizace úložiště
Od Windows Serveru 2019 jsme do služby Health Service přidali novou chybu, která se zobrazí při opětovné synchronizaci úložiště.
Pokud chcete zobrazit tento problém v PowerShellu, spusťte následující příkaz:
Get-HealthFault
Tato nová chyba se zobrazí v PowerShellu, v sestavě ověření clusteru a kdekoli jinde, kde je založena na chybách souvisejících se stavem systému.
Pokud chcete získat podrobnější zobrazení, můžete dotazovat databázi časových řad v PowerShellu následujícím způsobem:
Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded
Tady je příklad výstupu:
Object Description: ClusterNode Server1
Series Time Value Unit
------ ---- ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48 214 GB
Windows Admin Center používá chyby zdravotního stavu k nastavení stavu a barvy uzlů klastru. Na řídicím panelu HCI tato nová chyba umožňuje uzlům clusteru přejít z červené (dolů) na žlutou (resynchronizace) na zelenou (nahoru) místo přechodu přímo z červené na zelenou.
Následující obrázek porovnává, jak probíhá opětovná synchronizace úložiště ve Windows Serveru 2016 a Windows Serveru 2019.
Zobrazením celkového průběhu resynchronizace úložiště můžete přesně zjistit, kolik dat se nesynchronizuje a jestli váš systém postupuje dopředu. V Centru pro správu Windows přejděte na řídicí panel a podívejte se na nové upozornění, jak je znázorněno na následujícím snímku obrazovky:
Upozornění je užitečné, když vás informuje o probíhající opětovné synchronizaci, abyste omylem neodstavili více serverů (což může způsobit ovlivnění více domén selhání a vést k výpadku clusteru).
Pokud chcete získat podrobné zobrazení toho, jak se v Centru pro správu Systému Windows zobrazuje resynchronizace úložiště, přejděte na stránku Servery, klikněte na Inventářa zvolte konkrétní server. Přejděte na server a podívejte se na graf Storage, kde uvidíte množství dat, která je třeba opravit, zobrazené v fialové čáře s přesným číslem přímo nad ní. Tato částka se zvyšuje při výpadku serveru (je potřeba znovu synchronizovat více dat) a postupně se snižuje, když se server vrátí do režimu online (data se synchronizují). Když je množství dat, která je potřeba opravit, nula, vaše úložiště dokončilo opětovnou synchronizaci – pokud potřebujete, můžete teď vypnout server.
Následující snímek obrazovky zobrazuje zobrazení serveru v Centru pro správu Windows:
Monitorování resynchronizace úložiště ve Windows Serveru 2016
Výstraha dostupná ve Windows Serveru 2019 a novějších verzích je užitečná při získání uceleného přehledu o tom, co se děje ve vrstvě úložiště. Shrnuje informace, které můžete získat z cmdletu Get-StorageJob
. Tato rutina vrací informace o dlouhotrvajících úlohách modulu úložiště, jako je operace opravy v prostoru úložiště, jak je znázorněno v následujícím příkladu výstupu.
Get-StorageJob
Tady je příklad výstupu:
Name ElapsedTime JobState PercentComplete IsBackgroundTask
---- ----------- -------- --------------- ----------------
Regeneration 00:01:19 Running 50 True
Toto zobrazení nabízí podrobnější pohled, protože úlohy pro ukládání dat jsou uvedeny pro každý svazek. Zobrazí se seznam spuštěných úloh a můžete sledovat jejich individuální průběh. Tento cmdlet funguje na Windows Serveru 2016 i 2019.