Sdílet prostřednictvím


Vysvětlení a monitorování opětovné synchronizace úložiště

Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019

Upozornění na opětovnou synchronizaci úložiště je funkce Storage Spaces Direct v Azure Stack HCI a Windows Serveru. Služba Health Service umožňuje vyvolat chybu, která vás upozorní na opětovnou synchronizaci. To vám pomůže zabránit nechtěnému odstavení dalších serverů, což by mohlo mít vliv na několik domén selhání a vést k výpadku clusteru.

Tento článek poskytuje přehled o opětovné synchronizaci úložiště a o tom, jak ji můžete sledovat v clusteru pro převzetí služeb při selhání s technologií Storage Spaces Direct.

Informace o opětovné synchronizaci úložiště

Začněme jednoduchým příkladem, abychom pochopili, jak se úložiště může dostat ze synchronizace. Mějte na paměti, že toto chování vykazuje jakékoli řešení distribuovaného úložiště typu shared-nothing (pouze místní jednotky). Následující část ukazuje, jak se úložiště přestane synchronizovat, když dojde k výpadku jednoho uzlu serveru. Jeho disky se neaktualizují, dokud se nevrátí online – toto chování se vztahuje na jakoukoli hyperkonvergovanou architekturu.

Předpokládejme, že chcete uložit řetězec "HELLO".

Obrázek ASCII řetězce

Za předpokladu, že máte třícestnou odolnost zrcadla, máte tři kopie tohoto řetězce. Pokud server č. 1 dočasně vypnete (kvůli údržbě), nebudete mít přístup ke kopii #1.

Obrázek, který ukazuje, že nemáte přístup k číslu kopírování 1, pokud stisknete číslo serveru 1.

Předpokládejme, že v tuto chvíli aktualizujete řetězec z "HELLO" na "HELP!".

Obrázek ve formátu ASCII představující řetězec

Po aktualizaci řetězce se úspěšně aktualizují kopie #2 a #3. K kopii č. 1 se ale nedá získat přístup, protože server č. 1 je dočasně vypnutý (kvůli údržbě).

GIF zápisu ke zkopírování čísla 2 a 3.

Teď máte kopii č. 1 s nesynchronnými daty. Operační systém používá podrobné sledování nezašpiněných oblastí k udržení přehledu bitů, které nejsou synchronizované. Tímto způsobem, když se server č. 1 vrátí do online režimu, můžete změny synchronizovat tak, že načtete data z kopie č. 2 nebo #3 a přepíšete data v kopii č. 1. Pomocí tohoto přístupu je potřeba kopírovat pouze tato data, která jsou zastaralá, místo opětovné synchronizace všech dat ze serveru č. 2 nebo serveru č. 3.

GIF přepisování na kopii číslo 1.

Předchozí část popsala, jak se data mohou dostat mimo synchronizaci. Jak to ale vypadá na vyšší úrovni? Předpokládejme, že máte tříserverový hyperkonvergovaný cluster. Když je server č. 1 v údržbě, uvidíte, že je vypnutý. Při zálohování serveru #1 začne znovu synchronizovat všechna jeho úložiště pomocí podrobného sledování nezašpiněných oblastí (vysvětleno v předchozí části). Jakmile se data znovu synchronizují, zobrazí se všechny servery jako v pořádku.

Následující obrázek GIF ukazuje, jak funguje resynchronizace úložiště v hyperkonvergovaném clusteru:

gif zobrazení správce resynchronizace.

Monitorování resynchronizace úložiště

Od Windows Serveru 2019 jsme do služby Health Service přidali novou chybu, která se zobrazí při opětovné synchronizaci úložiště.

Pokud chcete zobrazit tento problém v PowerShellu, spusťte následující příkaz:

Get-HealthFault

Tato nová chyba se zobrazí v PowerShellu, v sestavě ověření clusteru a kdekoli jinde, kde je založena na chybách souvisejících se stavem systému.

Pokud chcete získat podrobnější zobrazení, můžete dotazovat databázi časových řad v PowerShellu následujícím způsobem:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Tady je příklad výstupu:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center používá chyby zdravotního stavu k nastavení stavu a barvy uzlů klastru. Na řídicím panelu HCI tato nová chyba umožňuje uzlům clusteru přejít z červené (dolů) na žlutou (resynchronizace) na zelenou (nahoru) místo přechodu přímo z červené na zelenou.

Následující obrázek porovnává, jak probíhá opětovná synchronizace úložiště ve Windows Serveru 2016 a Windows Serveru 2019.

obrázek Windows Serveru 2016 a Windows Serveru 2019 při resynchronizaci.

Zobrazením celkového průběhu resynchronizace úložiště můžete přesně zjistit, kolik dat se nesynchronizuje a jestli váš systém postupuje dopředu. V Centru pro správu Windows přejděte na řídicí panel a podívejte se na nové upozornění, jak je znázorněno na následujícím snímku obrazovky:

snímek obrazovky výstrahy v Centru pro správu Windows.

Upozornění je užitečné, když vás informuje o probíhající opětovné synchronizaci, abyste omylem neodstavili více serverů (což může způsobit ovlivnění více domén selhání a vést k výpadku clusteru).

Pokud chcete získat podrobné zobrazení toho, jak se v Centru pro správu Systému Windows zobrazuje resynchronizace úložiště, přejděte na stránku Servery, klikněte na Inventářa zvolte konkrétní server. Přejděte na server a podívejte se na graf Storage, kde uvidíte množství dat, která je třeba opravit, zobrazené v fialové čáře s přesným číslem přímo nad ní. Tato částka se zvyšuje při výpadku serveru (je potřeba znovu synchronizovat více dat) a postupně se snižuje, když se server vrátí do režimu online (data se synchronizují). Když je množství dat, která je potřeba opravit, nula, vaše úložiště dokončilo opětovnou synchronizaci – pokud potřebujete, můžete teď vypnout server.

Následující snímek obrazovky zobrazuje zobrazení serveru v Centru pro správu Windows:

snímek obrazovky zobrazení serveru v Centru pro správu Windows.

Monitorování resynchronizace úložiště ve Windows Serveru 2016

Výstraha dostupná ve Windows Serveru 2019 a novějších verzích je užitečná při získání uceleného přehledu o tom, co se děje ve vrstvě úložiště. Shrnuje informace, které můžete získat z cmdletu Get-StorageJob. Tato rutina vrací informace o dlouhotrvajících úlohách modulu úložiště, jako je operace opravy v prostoru úložiště, jak je znázorněno v následujícím příkladu výstupu.

Get-StorageJob

Tady je příklad výstupu:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Toto zobrazení nabízí podrobnější pohled, protože úlohy pro ukládání dat jsou uvedeny pro každý svazek. Zobrazí se seznam spuštěných úloh a můžete sledovat jejich individuální průběh. Tento cmdlet funguje na Windows Serveru 2016 i 2019.

Další odkazy