Sdílet prostřednictvím


Postupy údržby failover clusteru

Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Důležité

Azure Stack HCI je teď součástí Azure Local. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.

Tento článek předpokládá, že potřebujete vypnout fyzický server k provedení údržby nebo ho restartovat z nějakého jiného důvodu. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez přechodu serverů do offline režimu najdete v tématu Aktualizace clusterů Azure Stack HCI.

Vypnutí serveru pro údržbu vyžaduje offline režim částí úložiště, které jsou sdíleny mezi všemi servery v clusteru s podporou failoveru. To vyžaduje pozastavení serveru, který chcete převést do offline režimu, umístění disků serveru do režimu údržby, přesunutí clusterových rolí a virtuálních počítačů na jiné servery v clusteru a ověření, že všechna data jsou k dispozici na ostatních serverech v clusteru. Tento proces zajistí, že data zůstanou v bezpečí a budou přístupná během doby údržby.

K offline údržbě serveru můžete použít Windows Admin Center nebo PowerShell. Toto téma popisuje obě metody.

Převést server do offline režimu pomocí Centra pro správu Windows

Nejjednodušší způsob, jak se připravit na přechod serveru do offline režimu, je použití Centra pro správu Windows.

Ověřte, že je bezpečné převést server do režimu offline.

  1. Pomocí Centra pro správu Windows se připojte k serveru, který chcete převést do offline režimu. V nabídce >, vyberte Úložiště Disky a ověřte, že ve sloupci Stav pro každý virtuální disk zobrazuje Online.

  2. Pak vyberte > a ověřte, že sloupec Stav pro každý svazek zobrazuje Zdravý a že sloupec Status pro každý svazek zobrazuje OK.

Pozastavení a vyprázdnění serveru

Před vypnutím nebo restartováním serveru byste měli server pozastavit a vyprázdnit (přesunout) všechny clusterované role, jako jsou virtuální počítače, na kterých běží. Před tím, než je přepínáte do režimu offline kvůli údržbě, vždy pozastavte a vyprázdnte clusterované servery.

  1. Pomocí Centra pro správu Windows se připojte ke clusteru a pak v nabídce Nástroje ve Správci clusteru vyberte Výpočetní > servery.

  2. Vyberte inventář. Klikněte na název serveru, který chcete pozastavit a vyprázdnit, a vyberte Pozastavit. Měla by se zobrazit následující výzva:

    Pozastavit servery pro údržbu: Opravdu chcete pozastavit servery? Tím se úlohy, jako jsou virtuální počítače, přesunou na jiné servery v clusteru.

  3. Pokud chcete server pozastavit a zahájit proces vyprázdnění, vyberte ano . Stav serveru se zobrazí jako V údržbě, Vypouštění, a role jako Hyper-V a virtuální počítače zahájí okamžitou migraci za provozu na jiné servery v clusteru. Může to trvat několik minut. Do serveru nelze přidat žádné role, dokud se neobnoví. Po dokončení procesu vyprázdnění se stav serveru zobrazí jako V údržbě, Vyprazdňování dokončeno. Operační systém provádí automatickou bezpečnostní kontrolu, aby se zajistilo, že je bezpečné pokračovat. Pokud jsou svazky nezdravé, systém se zastaví a upozorní vás, že není bezpečné pokračovat.

Vypnutí serveru

Po dokončení vyprázdnění serveru můžete bezpečně vypnout údržbu nebo ho restartovat.

Varování

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před vypnutím serveru umístit disky do režimu údržby a před obnovením serveru do clusteru disky vyřaďte z režimu údržby.

Obnovení serveru

Až budete připravení, aby server začal hostovat clusterované role a virtuální počítače znovu, jednoduše server zapněte, počkejte, až se server spustí, a pomocí následujícího postupu obnovíte server.

  1. Ve Správci clusteru v nabídce Nástroje vlevo vyberte Výpočetní > servery.

  2. Vyberte inventář. Klikněte na název serveru, který chcete obnovit, a potom klikněte na Pokračovat.

Clusterované role a virtuální počítače okamžitě začnou migrovat za provozu zpět na server. Může to trvat několik minut.

Počkejte, než se úložiště znovu synchronizuje.

Když se server obnoví, musí se všechny nové zápisy, ke kterým došlo v době, kdy byla nedostupná, znovu synchronizovat. K tomu dochází automaticky pomocí inteligentního sledování změn. Není nutné, aby se všechna data kontrolovala nebo synchronizovala, pouze změny. Tento proces je omezený, aby se snížil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastaven a kolik nových dat bylo zapsáno, může dokončení trvat mnoho minut.

Důležité

Než přeberete všechny ostatní servery v clusteru do offline režimu, musíte počkat na dokončení opětovné synchronizace.

Pokud chcete zkontrolovat, jestli je resynchronizace úložiště hotová, postupujte takto:

  1. Připojte se ke clusteru pomocí Centra pro správu Windows a vyberte Úložiště > Svazky.
  2. Vyberte inventář.
  3. Zkontrolujte sloupec Stav pro každý svazek. Pokud se zobrazí OK, dokončí se opětovná synchronizace úložiště. Teď je bezpečné převést ostatní servery v clusteru do offline režimu.

Převést server do offline režimu pomocí PowerShellu

Pomocí následujících postupů můžete v clusteru pro převzetí služeb při selhání pomocí PowerShellu správně pozastavit, vyprázdnit a obnovit server.

Ověřte, že je bezpečné převést server do režimu offline.

Pokud chcete ověřit, že jsou všechny svazky v pořádku, spusťte jako správce následující příkaz:

Get-VirtualDisk

Tady je příklad, jak může výstup vypadat:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Ověřte, že vlastnost HealthStatus pro každý svazek je v pořádku a operationalStatus zobrazuje OK.

Pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, přejděte na úložištěDisky.

Pozastavení a vyprázdnění serveru

Spuštěním následující rutiny jako správce server pozastavte a vyprázdněte:

Suspend-ClusterNode -Drain

Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Pozastavit>Vyprázdnění rolí.

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, pozastavení a vyprázdnění serveru uvede disky serveru také do režimu údržby. Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).

Vložení disků do režimu údržby

V Azure Stack HCI verze 20H2, Windows Server 2019 a Windows Server 2016 přepnutí disků serveru do režimu údržby dává Storage Spaces Direct příležitost bezproblémově vyprázdnit a uložit data, aby vypnutí serveru neovlivnilo stav aplikací. Jakmile disk přejde do režimu údržby, už nepovolí zápisy. Aby bylo možné minimalizovat dobu synchronizace úložiště, doporučujeme disky přepnout do režimu údržby těsně před restartováním a jakmile systém opět funguje, vyřadit je z režimu údržby.

Poznámka:

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se při pozastavení a vyprázdnění serveru automaticky umístí do režimu údržby. Tyto operační systémy mají podrobnou funkci opravy, která umožňuje rychlejší opětovnou synchronizaci s menším dopadem na systémové a síťové zdroje, což umožňuje společné provádění údržby serveru a úložiště.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Vypnutí serveru

Po dokončení vyprázdnění serveru se v PowerShellu a Správci clusteru pro převzetí služeb při selhání zobrazí jako Pozastaveno.

Server teď můžete bezpečně vypnout nebo restartovat pomocí cmdletů PowerShell Stop-Computer nebo Restart-Computer nebo pomocí Správce převzetí služeb při selhání.

Poznámka:

Při spuštění Get-VirtualDisk příkazu na serverech, které vypínají nebo spouští nebo zastavují službu clusteru, může být provozní stav serveru hlášen jako neúplný nebo snížený a sloupec Stav může obsahovat upozornění. To je normální a nemělo by to vyvolávat obavy. Všechny vaše svazky zůstanou online a přístupné.

Vynechejte disky z režimu údržby

Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před obnovením serveru do clusteru zakázat režim údržby úložiště na discích. Pokud chcete minimalizovat dobu resynchronizace úložiště, doporučujeme je okamžitě po zálohování systému přenést z režimu údržby.

Poznámka:

Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se po obnovení serveru automaticky vysadí z režimu údržby.

Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu a zakažte režim údržby úložiště:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Obnovení serveru

Znovu připojte server do clustru. Chcete-li obnovit clusterové role a virtuální počítače, které byly dříve spuštěny na serveru, použijte volitelný příznak -Failback.

Resume-ClusterNode –Failback Immediate

Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na Uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Pokračovat>Vrátit role zpět.

Jakmile se server obnoví, zobrazí se jako Online v PowerShellu a ve Správci clusteru s podporou převzetí služeb při selhání.

Počkejte, než se úložiště znovu synchronizuje.

Když se server obnoví, musíte počkat, až se dokončí opětovná synchronizace, a teprve potom převést všechny ostatní servery v clusteru do offline režimu.

Spusťte následující cmdlet jako správce pro sledování průběhu:

Get-StorageJob

Pokud se synchronizace už dokončila, nezobrazí se žádný výstup.

Tady je příklad výstupu, který ukazuje, že jsou stále spuštěné úlohy resynchronizace (opravy):

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Sloupec BytesTotal ukazuje, kolik úložiště je potřeba znovu synchronizovat. Ve sloupci PercentComplete se zobrazuje průběh.

Varování

Není bezpečné převést jiný server do offline režimu, dokud tyto opravy nedokončí.

Během této doby se pod HealthStatus budou vaše svazky dál zobrazovat jako Upozornění, což je normální.

Pokud například použijete rutinu Get-VirtualDisk při opětovné synchronizaci úložiště, může se zobrazit následující výstup:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po dokončení úloh zajistěte pomocí rutiny , že se svazky opět zobrazí Get-VirtualDisk. Tady je příklad výstupu:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teď je bezpečné pozastavit a restartovat ostatní servery v clusteru.

Další kroky

Související informace najdete také: