Postupy údržby clusteru s podporou převzetí služeb při selhání

Článek
11/23/2024

Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Důležité

Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek předpokládá, že potřebujete vypnout fyzický server k provedení údržby nebo ho restartovat z nějakého jiného důvodu. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez přechodu serverů do offline režimu najdete v tématu Aktualizace clusterů Azure Stack HCI.

Přepnutí serveru do offline režimu pro údržbu vyžaduje, aby se části úložiště offline sdílely na všech serverech v clusteru s podporou převzetí služeb při selhání. To vyžaduje pozastavení serveru, který chcete převést do offline režimu, umístění disků serveru do režimu údržby, přesunutí clusterových rolí a virtuálních počítačů na jiné servery v clusteru a ověření, že všechna data jsou k dispozici na ostatních serverech v clusteru. Tento proces zajistí, že data zůstanou v bezpečí a budou přístupná během doby údržby.

K offline údržbě serveru můžete použít Windows Admin Center nebo PowerShell. Toto téma popisuje obě metody.

Převést server do offline režimu pomocí Centra pro správu Windows

Nejjednodušší způsob, jak se připravit na přechod serveru do offline režimu, je použití Centra pro správu Windows.

Ověřte, že je bezpečné převést server do režimu offline.

Pomocí Centra pro správu Windows se připojte k serveru, který chcete převést do offline režimu. V nabídce Nástroje vyberte Disky úložiště > a ověřte, že se ve sloupci Stav pro každý virtuální disk zobrazuje Online.
Pak vyberte Svazky úložiště a ověřte, že sloupec Stav pro každý svazek je v pořádku a že sloupec Stav pro každý svazek zobrazuje OK.>

Pozastavení a vyprázdnění serveru

Před vypnutím nebo restartováním serveru byste měli server pozastavit a vyprázdnit (přesunout) všechny clusterované role, jako jsou virtuální počítače, na kterých běží. Před tím, než je přepínáte do režimu offline kvůli údržbě, vždy pozastavte a vyprázdnte clusterované servery.

Pomocí Centra pro správu Windows se připojte ke clusteru a pak v nabídce Nástroje ve Správci clusteru vyberte Výpočetní > servery.
Vyberte skladový model. Klikněte na název serveru, který chcete pozastavit a vyprázdnit, a vyberte Pozastavit. Měla by se zobrazit následující výzva:

Pozastavit servery pro údržbu: Opravdu chcete pozastavit servery? Tím se úlohy, jako jsou virtuální počítače, přesunou na jiné servery v clusteru.
Pokud chcete server pozastavit a zahájit proces vyprázdnění, vyberte ano . Stav serveru se zobrazí jako Při údržbě, vyprázdnění a rolích, jako jsou Hyper-V a virtuální počítače, se okamžitě zahájí migrace za provozu na jiné servery v clusteru. Může to trvat několik minut. Do serveru nelze přidat žádné role, dokud se neobnoví. Po dokončení procesu vyprázdnění se stav serveru zobrazí jako V údržbě, Vyprazdňování dokončeno. Operační systém provádí automatickou bezpečnostní kontrolu, aby se zajistilo, že je bezpečné pokračovat. Pokud nějaké svazky nejsou v pořádku, zastaví se a upozorní vás, že není bezpečné pokračovat.

Vypnutí serveru

Po dokončení vyprázdnění serveru můžete bezpečně vypnout údržbu nebo ho restartovat.

Upozorňující

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před vypnutím serveru umístit disky do režimu údržby a před obnovením serveru do clusteru disky vyřaďte z režimu údržby.

Obnovení serveru

Až budete připravení, aby server začal hostovat clusterované role a virtuální počítače znovu, jednoduše server zapněte, počkejte, až se server spustí, a pomocí následujícího postupu obnovíte server.

Ve Správci clusteru v nabídce Nástroje vlevo vyberte Výpočetní > servery.
Vyberte skladový model. Klikněte na název serveru, který chcete obnovit, a potom klikněte na Pokračovat.

Clusterované role a virtuální počítače okamžitě začnou migrovat za provozu zpět na server. Může to trvat několik minut.

Počkejte, než se úložiště znovu synchronizuje.

Když se server obnoví, musí se všechny nové zápisy, ke kterým došlo v době, kdy byla nedostupná, znovu synchronizovat. K tomu dochází automaticky pomocí inteligentního sledování změn. Není nutné, aby se všechna data kontrolovala nebo synchronizovala, pouze změny. Tento proces je omezený, aby se snížil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastaven a kolik nových dat bylo zapsáno, může dokončení trvat mnoho minut.

Důležité

Než přeberete všechny ostatní servery v clusteru do offline režimu, musíte počkat na dokončení opětovné synchronizace.

Pokud chcete zkontrolovat, jestli je resynchronizace úložiště hotová, postupujte takto:

Připojte se ke clusteru pomocí Centra pro správu Windows a vyberte Svazky úložiště>.
Vyberte skladový model.
Zkontrolujte sloupec Stav pro každý svazek. Pokud se zobrazí OK, dokončí se opětovná synchronizace úložiště. Teď je bezpečné převést ostatní servery v clusteru do offline režimu.

Převést server do offline režimu pomocí PowerShellu

Pomocí následujících postupů můžete pomocí PowerShellu správně pozastavit, vyprázdnit a obnovit server v clusteru s podporou převzetí služeb při selhání.

Ověřte, že je bezpečné převést server do režimu offline.

Pokud chcete ověřit, že jsou všechny svazky v pořádku, spusťte jako správce následující rutinu:

Get-VirtualDisk

Tady je příklad, jak může výstup vypadat:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Ověřte, že vlastnost HealthStatus pro každý svazek je v pořádku a operationalStatus zobrazuje OK.

Pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, přejděte na Disky úložiště>.

Pozastavení a vyprázdnění serveru

Spuštěním následující rutiny jako správce server pozastavte a vyprázdněte:

Suspend-ClusterNode -Drain

Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Pozastavit>vyprázdnění rolí.

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, pozastaví a vyprázdní server také disky serveru do režimu údržby. Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).

Vložení disků do režimu údržby

V Azure Stack HCI verze 20H2, Windows Serveru 2019 a Windows Serveru 2016 poskytuje uvedení disků serveru do režimu údržby Prostory úložiště s přímým přístupem příležitost řádně vyprázdnit a potvrdit data, aby se zajistilo, že vypnutí serveru nemá vliv na stav aplikace. Jakmile disk přejde do režimu údržby, už nepovolí zápisy. Pokud chcete minimalizovat dobu opětovné synchronizace úložiště, doporučujeme disky umístit do režimu údržby hned před restartováním a jakmile se systém zálohuje.

Poznámka:

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se při pozastavení a vyprázdnění serveru automaticky umístí do režimu údržby. Tyto operační systémy mají podrobnou funkci opravy, která umožňuje rychlejší a méně ovlivněné systémové a síťové prostředky, což umožňuje provádět údržbu serveru a úložiště společně.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Vypnutí serveru

Po dokončení vyprázdnění serveru se v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání zobrazí jako Pozastaveno .

Server teď můžete bezpečně vypnout nebo restartovat pomocí Stop-Computer rutin prostředí Restart-Computer PowerShell nebo pomocí Správce clusteru s podporou převzetí služeb při selhání.

Poznámka:

Při spuštění Get-VirtualDisk příkazu na serverech, které vypínají nebo spouští nebo zastavují službu clusteru, může být provozní stav serveru hlášen jako neúplný nebo snížený a sloupec Stav může obsahovat upozornění. To je normální a nemělo by to mít obavy. Všechny vaše svazky zůstanou online a přístupné.

Vynechejte disky z režimu údržby

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před obnovením serveru do clusteru zakázat režim údržby úložiště na discích. Pokud chcete minimalizovat dobu resynchronizace úložiště, doporučujeme je okamžitě po zálohování systému přenést z režimu údržby.

Poznámka:

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se po obnovení serveru automaticky vysadí z režimu údržby.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu a zakažte režim údržby úložiště:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Obnovení serveru

Obnovte server do clusteru. Pokud chcete vrátit clusterové role a virtuální počítače, které byly dříve spuštěné na serveru, použijte volitelný příznak -Navrácení služeb po obnovení :

Resume-ClusterNode –Failback Immediate

Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na Uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Obnovit>role navrácení služeb po obnovení.

Po obnovení se server zobrazí jako Up v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání.

Počkejte, než se úložiště znovu synchronizuje.

Když se server obnoví, musíte počkat, až se dokončí opětovná synchronizace, a teprve potom převést všechny ostatní servery v clusteru do offline režimu.

Spuštěním následující rutiny jako správce sledujte průběh:

Get-StorageJob

Pokud se synchronizace už dokončila, nezobrazí se žádný výstup.

Tady je příklad výstupu, který ukazuje, že jsou stále spuštěné úlohy resynchronizace (opravy):

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Sloupec BytesTotal ukazuje, kolik úložiště je potřeba znovu synchronizovat. Ve sloupci PercentComplete se zobrazuje průběh.

Upozorňující

Není bezpečné převést jiný server do offline režimu, dokud tyto opravy nedokončí.

Během této doby se svazky v části HealthStatus budou dál zobrazovat jako Upozornění, což je normální.

Pokud například použijete rutinu Get-VirtualDisk při opětovné synchronizaci úložiště, může se zobrazit následující výstup:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po dokončení úloh pomocí rutiny ověřte, že se svazky znovu zobrazují v pořádkuGet-VirtualDisk. Tady je příklad výstupu:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teď je bezpečné pozastavit a restartovat ostatní servery v clusteru.

Další kroky

Související informace najdete také:

Sdílet prostřednictvím

Postupy údržby clusteru s podporou převzetí služeb při selhání

Převést server do offline režimu pomocí Centra pro správu Windows

Ověřte, že je bezpečné převést server do režimu offline.

Pozastavení a vyprázdnění serveru

Vypnutí serveru

Obnovení serveru

Počkejte, než se úložiště znovu synchronizuje.

Převést server do offline režimu pomocí PowerShellu

Ověřte, že je bezpečné převést server do režimu offline.

Pozastavení a vyprázdnění serveru

Vložení disků do režimu údržby

Vypnutí serveru

Vynechejte disky z režimu údržby

Obnovení serveru

Počkejte, než se úložiště znovu synchronizuje.

Další kroky

Váš názor

Další materiály