Underhållsprocedurer för failover-kluster

Artikel
03/09/2025

Gäller för: Azure Stack HCI, versionerna 22H2 och 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Viktigt!

Azure Stack HCI är nu en del av Azure Local. Äldre versioner av Azure Stack HCI, till exempel 22H2, fortsätter dock att referera till Azure Stack HCI och återspeglar inte namnändringen. Läs mer.

Den här artikeln förutsätter att du måste stänga av en fysisk server för att utföra underhåll eller starta om den av någon annan anledning. Information om hur du installerar uppdateringar på ett Azure Stack HCI-kluster utan att ta servrar offline finns i Uppdatera Azure Stack HCI-kluster.

Om du tar en server offline för underhåll måste du ta delar av lagringen offline som delas mellan alla servrar i ett redundanskluster. Detta kräver att du pausar den server som du vill koppla från, placerar serverns diskar i underhållsläge, flyttar klustrade roller och virtuella datorer till andra servrar i klustret och kontrollerar att alla data är tillgängliga på de andra servrarna i klustret. Den här processen säkerställer att data förblir säkra och tillgängliga under hela underhållsperioden.

Du kan använda antingen Windows Admin Center eller PowerShell för att ta en server offline för underhåll. Det här avsnittet beskriver båda metoderna.

Ta en server offline med Windows administrationscenter

Det enklaste sättet att förbereda för att ta en server offline är att använda Administrationscenter för Windows.

Kontrollera att det är säkert att ta servern offline

Anslut till servern du vill ta offline med hjälp av Windows Administrationscenter. Välj Lagringsdiskar > på menyn Verktyg och kontrollera att kolumnen Status för varje virtuell disk visar Online.
Välj sedan Lagringsvolymer > och kontrollera att kolumnen Hälsa för varje volym visar Felfri och att kolumnen Status för varje volym visar OK.

Pausa och tömma servern

Innan du stänger av eller startar om en server bör du pausa servern och tömma (flytta bort) alla klustrade roller, till exempel virtuella datorer som körs på den. Pausa alltid och töm klustrade servrar innan du stänger av dem för underhåll.

Använd Windows Administrationscenter, anslut till klustret och välj sedan Beräkningsservrar > på menyn Verktyg i Klusterhanteraren.
Välj Lager. Klicka på namnet på den server som du vill pausa och tömma och välj Pausa. Du bör se följande uppmaning:

Pausa servrar för underhåll: Är du säker på att du vill pausa server/servrar? Detta flyttar arbetsbelastningar, till exempel virtuella datorer, till andra servrar i klustret.
Välj Ja för att pausa servern och initiera avloppsprocessen. Serverns status visas som Under underhåll, Tömning, och roller som Hyper-V och VM:er kommer att påbörja direktmigrering till andra servrar i klustret. Det kan ta några minuter. Inga roller kan läggas till på servern förrän den har återupptagits. När tömningsprocessen är klar visas serverstatusen som Under underhåll, Töm har slutförts. Operativsystemet utför en automatisk säkerhetskontroll för att säkerställa att det är säkert att fortsätta. Om det finns ohälsosamma volymer kommer det att stanna och varna dig om att det inte är säkert att fortsätta.

Stäng av servern

När servern har tömts kan du stänga av den på ett säkert sätt för underhåll eller starta om den.

Varning

Om servern kör Azure Stack HCI, version 20H2, Windows Server 2019 eller Windows Server 2016 måste du placera diskarna i underhållsläge innan du stänger av servern och ta diskarna ur underhållsläge innan du återupptar servern i klustret.

Återuppta servern

När du är redo för servern att börja vara värd för klustrade roller och virtuella datorer igen slår du bara på servern, väntar tills den har startat och återupptar driften av servern med hjälp av följande steg.

I Klusterhanteraren väljer du Beräkningsservrar > på menyn Verktyg till vänster.
Välj Lager. Klicka på namnet på den server som du vill återuppta och klicka sedan på Återuppta.

Klustrade roller och virtuella datorer börjar direkt migrera tillbaka till servern. Det kan ta några minuter.

Vänta tills lagringen har synkroniserats om

När servern återupptas måste alla nya skrivningar som inträffade när den inte var tillgänglig synkroniseras om. Detta sker automatiskt med hjälp av intelligent ändringsspårning. Det är inte nödvändigt att alla data genomsöks eller synkroniseras, utan endast ändringarna. Den här processen begränsas för att minska påverkan på produktionsarbetsbelastningar. Beroende på hur länge servern pausades och hur mycket nya data som skrevs kan det ta många minuter att slutföra.

Viktigt!

Du måste vänta tills omsynkroniseringen har slutförts innan du tar andra servrar i klustret offline.

Så här kontrollerar du om lagringssynkronisering är klar:

Anslut till klustret med Hjälp av Windows Administrationscenter och välj Lagringsvolymer>.
Välj Lager.
Kontrollera kolumnen Status för varje volym. Om det visar OK är lagringssynkronisering klar. Det är nu säkert att ta andra servrar i klustret offline.

Koppla från en server med PowerShell

Använd följande procedurer för att pausa, tömma och återuppta en server i ett redundanskluster med hjälp av PowerShell.

Kontrollera att det är säkert att ta servern offline

Kontrollera att alla dina volymer är felfria genom att köra följande cmdlet som administratör:

Get-VirtualDisk

Här är ett exempel på hur utdata kan se ut:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Kontrollera att egenskapen HealthStatus för varje volym är Felfri och att OperationalStatus visar OK.

Om du vill göra detta med hjälp av Failover Cluster Manager går du till Lagring>Diskar.

Pausa och tömma servern

Kör följande cmdlet som administratör för att pausa och tömma servern:

Suspend-ClusterNode -Drain

För att göra detta i Klusterhanteraren för växling vid fel, gå till Noder, högerklicka på noden och välj sedan Pausa>Töm roller.

Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022 kommer pausning och tömning av servern också att försätta serverns diskar i underhållsläge. Om servern kör Azure Stack HCI, version 20H2, Windows Server 2019 eller Windows Server 2016 måste du göra detta manuellt (se nästa steg).

Placera diskar i underhållsläge

I Azure Stack HCI, version 20H2, Windows Server 2019 och Windows Server 2016, sätts serverns diskar i underhållsläge ger det Storage Spaces Direct en möjlighet att graciöst rensa och sammanställa data för att säkerställa att avstängning av servern inte påverkar applikationstillståndet. Så snart en disk hamnar i underhållsläge tillåter den inte längre skrivningar. För att minimera lagrings-återsynkroniseringstider rekommenderar vi att sätta diskarna i underhållsläge precis före omstarten och ta dem ur underhållsläge så snart systemet är uppe igen.

Kommentar

Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022 kan du hoppa över det här steget eftersom diskarna automatiskt sätts i underhållsläge när servern pausas och töms. Dessa operativsystem har en detaljerad reparationsfunktion som gör omsynkronisering snabbare och mindre påverkar system- och nätverksresurser, vilket gör det möjligt att utföra server- och lagringsunderhåll tillsammans.

Om servern kör Windows Server 2019 eller Azure Stack HCI version 20H2 kör du följande cmdlet som administratör:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Om servern kör Windows Server 2016 använder du följande syntax i stället:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Stäng av servern

När servern har tömts visas den som Pausad i PowerShell och Failoverklusterhanteraren.

Du kan nu på ett säkert sätt stänga av eller starta om servern med hjälp av cmdletarna Stop-Computer eller PowerShell-cmdletarna Restart-Computer, eller genom att använda Klusterhanteraren för failover.

Kommentar

När du kör ett Get-VirtualDisk kommando på servrar som stänger av eller startar/stoppar klustertjänsten kan serverns driftstatus rapporteras som ofullständig eller degraderad, och kolumnen Hälsostatus kan visa en varning. Detta är normalt och bör inte orsaka oro. Alla dina volymer förblir online och tillgängliga.

Ta bort diskar från underhållsläget

Om servern kör Azure Stack HCI, version 20H2, Windows Server 2019 eller Windows Server 2016 måste du inaktivera lagringsunderhållsläget på diskarna innan du återupptar servern i klustret. För att minimera tiden för lagringsresynkronisering rekommenderar vi att du tar bort dem från underhållsläge så snart systemet är uppe igen.

Kommentar

Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022 kan du hoppa över det här steget eftersom diskarna automatiskt tas ur underhållsläge när servern återupptas.

Om servern kör Windows Server 2019 eller Azure Stack HCI version 20H2 kör du följande cmdlet som administratör för att inaktivera lagringsunderhållsläget:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Om servern kör Windows Server 2016 använder du följande syntax i stället:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Återuppta servern

Återanslut servern till klustret. För att återställa de klustrade rollerna och virtuella datorerna som tidigare kördes på servern, använd den valfria flaggan -Failback:

Resume-ClusterNode –Failback Immediate

Om du vill göra detta i Klusterhanteraren för växling vid fel går du till Noder, högerklickar på noden och väljer Återuppta>Överför roller tillbaka.

När servern har återupptagits, kommer den att visas som Upp i PowerShell och Failover-klusterhanteraren.

Vänta tills lagringen har synkroniserats om

När servern återupptas måste du vänta tills omsynkroniseringen har slutförts innan du tar andra servrar i klustret offline.

Kör följande cmdlet som administratör för att övervaka förloppet:

Get-StorageJob

Om omsynkroniseringen redan har slutförts får du inga utdata.

Här är några exempel på utdata som visar omsynkroniseringsjobb (reparation) som fortfarande körs:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Kolumnen BytesTotal visar hur mycket lagringsutrymme som behöver synkroniseras om. Kolumnen PercentComplete visar förloppet.

Varning

Det är inte säkert att ta en annan server offline förrän reparationsjobben har slutförts.

Under den här tiden, i HealthStatus, fortsätter dina volymer att visas som Varning, vilket är normalt.

Om du till exempel använder cmdleten Get-VirtualDisk när lagringen synkroniseras igen kan följande utdata visas:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

När jobben har slutförts kontrollerar du att volymerna visar Felfri igen med hjälp av cmdleten Get-VirtualDisk . Här är några exempel på utdata:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Det är nu säkert att pausa och starta om andra servrar i klustret.

Nästa steg

Relaterad information finns också:

Dela via

Underhållsprocedurer för failover-kluster

Ta en server offline med Windows administrationscenter

Kontrollera att det är säkert att ta servern offline

Pausa och tömma servern

Stäng av servern

Återuppta servern

Vänta tills lagringen har synkroniserats om

Koppla från en server med PowerShell

Kontrollera att det är säkert att ta servern offline

Pausa och tömma servern

Placera diskar i underhållsläge

Stäng av servern

Ta bort diskar från underhållsläget

Återuppta servern

Vänta tills lagringen har synkroniserats om

Nästa steg

Feedback

Ytterligare resurser