Postupy údržby clusteru s podporou převzetí služeb při selhání
Platí pro: Azure Stack HCI, verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Důležité
Azure Stack HCI je teď součástí Azure Local. Probíhá přejmenování dokumentace k produktu. Starší verze Azure Stack HCI, například 22H2, ale budou dál odkazovat na Azure Stack HCI a nebudou odrážet změnu názvu. Další informace.
Tento článek předpokládá, že potřebujete vypnout fyzický server k provedení údržby nebo ho restartovat z nějakého jiného důvodu. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez přechodu serverů do offline režimu najdete v tématu Aktualizace clusterů Azure Stack HCI.
Přepnutí serveru do offline režimu pro údržbu vyžaduje, aby se části úložiště offline sdílely na všech serverech v clusteru s podporou převzetí služeb při selhání. To vyžaduje pozastavení serveru, který chcete převést do offline režimu, umístění disků serveru do režimu údržby, přesunutí clusterových rolí a virtuálních počítačů na jiné servery v clusteru a ověření, že všechna data jsou k dispozici na ostatních serverech v clusteru. Tento proces zajistí, že data zůstanou v bezpečí a budou přístupná během doby údržby.
K offline údržbě serveru můžete použít Windows Admin Center nebo PowerShell. Toto téma popisuje obě metody.
Převést server do offline režimu pomocí Centra pro správu Windows
Nejjednodušší způsob, jak se připravit na přechod serveru do offline režimu, je použití Centra pro správu Windows.
Ověřte, že je bezpečné převést server do režimu offline.
Pomocí Centra pro správu Windows se připojte k serveru, který chcete převést do offline režimu. V nabídce Nástroje vyberte Disky úložiště > a ověřte, že se ve sloupci Stav pro každý virtuální disk zobrazuje Online.
Pak vyberte Svazky úložiště a ověřte, že sloupec Stav pro každý svazek je v pořádku a že sloupec Stav pro každý svazek zobrazuje OK.>
Pozastavení a vyprázdnění serveru
Před vypnutím nebo restartováním serveru byste měli server pozastavit a vyprázdnit (přesunout) všechny clusterované role, jako jsou virtuální počítače, na kterých běží. Před tím, než je přepínáte do režimu offline kvůli údržbě, vždy pozastavte a vyprázdnte clusterované servery.
Pomocí Centra pro správu Windows se připojte ke clusteru a pak v nabídce Nástroje ve Správci clusteru vyberte Výpočetní > servery.
Vyberte skladový model. Klikněte na název serveru, který chcete pozastavit a vyprázdnit, a vyberte Pozastavit. Měla by se zobrazit následující výzva:
Pozastavit servery pro údržbu: Opravdu chcete pozastavit servery? Tím se úlohy, jako jsou virtuální počítače, přesunou na jiné servery v clusteru.
Pokud chcete server pozastavit a zahájit proces vyprázdnění, vyberte ano . Stav serveru se zobrazí jako Při údržbě, vyprázdnění a rolích, jako jsou Hyper-V a virtuální počítače, se okamžitě zahájí migrace za provozu na jiné servery v clusteru. Může to trvat několik minut. Do serveru nelze přidat žádné role, dokud se neobnoví. Po dokončení procesu vyprázdnění se stav serveru zobrazí jako V údržbě, Vyprazdňování dokončeno. Operační systém provádí automatickou bezpečnostní kontrolu, aby se zajistilo, že je bezpečné pokračovat. Pokud nějaké svazky nejsou v pořádku, zastaví se a upozorní vás, že není bezpečné pokračovat.
Vypnutí serveru
Po dokončení vyprázdnění serveru můžete bezpečně vypnout údržbu nebo ho restartovat.
Upozorňující
Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před vypnutím serveru umístit disky do režimu údržby a před obnovením serveru do clusteru disky vyřaďte z režimu údržby.
Obnovení serveru
Až budete připravení, aby server začal hostovat clusterované role a virtuální počítače znovu, jednoduše server zapněte, počkejte, až se server spustí, a pomocí následujícího postupu obnovíte server.
Ve Správci clusteru v nabídce Nástroje vlevo vyberte Výpočetní > servery.
Vyberte skladový model. Klikněte na název serveru, který chcete obnovit, a potom klikněte na Pokračovat.
Clusterované role a virtuální počítače okamžitě začnou migrovat za provozu zpět na server. Může to trvat několik minut.
Počkejte, než se úložiště znovu synchronizuje.
Když se server obnoví, musí se všechny nové zápisy, ke kterým došlo v době, kdy byla nedostupná, znovu synchronizovat. K tomu dochází automaticky pomocí inteligentního sledování změn. Není nutné, aby se všechna data kontrolovala nebo synchronizovala, pouze změny. Tento proces je omezený, aby se snížil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastaven a kolik nových dat bylo zapsáno, může dokončení trvat mnoho minut.
Důležité
Než přeberete všechny ostatní servery v clusteru do offline režimu, musíte počkat na dokončení opětovné synchronizace.
Pokud chcete zkontrolovat, jestli je resynchronizace úložiště hotová, postupujte takto:
- Připojte se ke clusteru pomocí Centra pro správu Windows a vyberte Svazky úložiště>.
- Vyberte skladový model.
- Zkontrolujte sloupec Stav pro každý svazek. Pokud se zobrazí OK, dokončí se opětovná synchronizace úložiště. Teď je bezpečné převést ostatní servery v clusteru do offline režimu.
Převést server do offline režimu pomocí PowerShellu
Pomocí následujících postupů můžete pomocí PowerShellu správně pozastavit, vyprázdnit a obnovit server v clusteru s podporou převzetí služeb při selhání.
Ověřte, že je bezpečné převést server do režimu offline.
Pokud chcete ověřit, že jsou všechny svazky v pořádku, spusťte jako správce následující rutinu:
Get-VirtualDisk
Tady je příklad, jak může výstup vypadat:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Ověřte, že vlastnost HealthStatus pro každý svazek je v pořádku a operationalStatus zobrazuje OK.
Pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, přejděte na Disky úložiště>.
Pozastavení a vyprázdnění serveru
Spuštěním následující rutiny jako správce server pozastavte a vyprázdněte:
Suspend-ClusterNode -Drain
Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Pozastavit>vyprázdnění rolí.
Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, pozastaví a vyprázdní server také disky serveru do režimu údržby. Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).
Vložení disků do režimu údržby
V Azure Stack HCI verze 20H2, Windows Serveru 2019 a Windows Serveru 2016 poskytuje uvedení disků serveru do režimu údržby Prostory úložiště s přímým přístupem příležitost řádně vyprázdnit a potvrdit data, aby se zajistilo, že vypnutí serveru nemá vliv na stav aplikace. Jakmile disk přejde do režimu údržby, už nepovolí zápisy. Pokud chcete minimalizovat dobu opětovné synchronizace úložiště, doporučujeme disky umístit do režimu údržby hned před restartováním a jakmile se systém zálohuje.
Poznámka:
Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se při pozastavení a vyprázdnění serveru automaticky umístí do režimu údržby. Tyto operační systémy mají podrobnou funkci opravy, která umožňuje rychlejší a méně ovlivněné systémové a síťové prostředky, což umožňuje provádět údržbu serveru a úložiště společně.
Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Vypnutí serveru
Po dokončení vyprázdnění serveru se v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání zobrazí jako Pozastaveno .
Server teď můžete bezpečně vypnout nebo restartovat pomocí Stop-Computer
rutin prostředí Restart-Computer
PowerShell nebo pomocí Správce clusteru s podporou převzetí služeb při selhání.
Poznámka:
Při spuštění Get-VirtualDisk
příkazu na serverech, které vypínají nebo spouští nebo zastavují službu clusteru, může být provozní stav serveru hlášen jako neúplný nebo snížený a sloupec Stav může obsahovat upozornění. To je normální a nemělo by to mít obavy. Všechny vaše svazky zůstanou online a přístupné.
Vynechejte disky z režimu údržby
Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte před obnovením serveru do clusteru zakázat režim údržby úložiště na discích. Pokud chcete minimalizovat dobu resynchronizace úložiště, doporučujeme je okamžitě po zálohování systému přenést z režimu údržby.
Poznámka:
Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se po obnovení serveru automaticky vysadí z režimu údržby.
Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte jako správce následující rutinu a zakažte režim údržby úložiště:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Pokud server používá Windows Server 2016, použijte místo toho následující syntaxi:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Obnovení serveru
Obnovte server do clusteru. Pokud chcete vrátit clusterové role a virtuální počítače, které byly dříve spuštěné na serveru, použijte volitelný příznak -Navrácení služeb po obnovení :
Resume-ClusterNode –Failback Immediate
Chcete-li to provést ve Správci clusteru s podporou převzetí služeb při selhání, přejděte na Uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte Obnovit>role navrácení služeb po obnovení.
Po obnovení se server zobrazí jako Up v PowerShellu a Správci clusteru s podporou převzetí služeb při selhání.
Počkejte, než se úložiště znovu synchronizuje.
Když se server obnoví, musíte počkat, až se dokončí opětovná synchronizace, a teprve potom převést všechny ostatní servery v clusteru do offline režimu.
Spuštěním následující rutiny jako správce sledujte průběh:
Get-StorageJob
Pokud se synchronizace už dokončila, nezobrazí se žádný výstup.
Tady je příklad výstupu, který ukazuje, že jsou stále spuštěné úlohy resynchronizace (opravy):
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
Sloupec BytesTotal ukazuje, kolik úložiště je potřeba znovu synchronizovat. Ve sloupci PercentComplete se zobrazuje průběh.
Upozorňující
Není bezpečné převést jiný server do offline režimu, dokud tyto opravy nedokončí.
Během této doby se svazky v části HealthStatus budou dál zobrazovat jako Upozornění, což je normální.
Pokud například použijete rutinu Get-VirtualDisk
při opětovné synchronizaci úložiště, může se zobrazit následující výstup:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Po dokončení úloh pomocí rutiny ověřte, že se svazky znovu zobrazují v pořádkuGet-VirtualDisk
. Tady je příklad výstupu:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Teď je bezpečné pozastavit a restartovat ostatní servery v clusteru.
Další kroky
Související informace najdete také: