Wartungsverfahren für Failovercluster

Artikel
11/23/2024

Gilt für: Azure Stack HCI, Versionen 22H2 und 21H2, Windows Server 2022, Windows Server 2019, Windows Server 2016

Wichtig

Azure Stack HCI ist jetzt Teil von Azure Local. Die Umbenennung der Produktdokumentation wird ausgeführt. Ältere Versionen von Azure Stack HCI, z. B. 22H2, verweisen jedoch weiterhin auf Azure Stack HCI und spiegeln die Namensänderung nicht wider. Weitere Informationen

In diesem Artikel wird vorausgesetzt, dass Sie einen physischen Server ausschalten müssen, um Wartungsarbeiten auszuführen, oder ihn aus einem anderen Grund neu starten müssen. Informationen zum Installieren von Updates in einem Azure Stack HCI-Cluster, ohne Server offline zu schalten, finden Sie unter Aktualisieren von Azure Stack HCI-Clustern.

Wenn Sie einen Server zur Wartung offline nehmen, müssen hierfür Teile des Speichers offline geschaltet werden, die von allen Servern in einem Failovercluster gemeinsam verwendet werden. Hierfür muss der Server angehalten werden, der offline geschaltet werden soll, die Datenträger des Servers müssen in den Wartungsmodus gesetzt werden, Clusterrollen und virtuelle Computer (VMs) müssen auf andere Server im Cluster verschoben werden, und es muss überprüft werden, ob alle Daten auf den anderen Servern im Cluster verfügbar sind. Durch diesen Vorgang wird sichergestellt, dass die Daten während des gesamten Wartungszeitraums sicher und zugänglich bleiben.

Sie können Windows Admin Center oder PowerShell verwenden, um einen Server zur Wartung offline zu schalten. In diesem Thema werden beide Methoden behandelt.

Offlineschalten eines Servers über Windows Admin Center

Die einfachste Möglichkeit, das Offlineschalten eines Servers vorzubereiten, ist die Verwendung des Windows Admin Centers.

Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.

Stellen Sie mithilfe des Windows Admin Centers eine Verbindung mit dem Server her, den Sie offline schalten möchten. Wählen Sie im Menü Tools die Option Speicher > Datenträger aus, und überprüfen Sie, ob in der Spalte Status für jeden virtuellen Datenträger Online angezeigt wird.
Wählen Sie dann Speicher > Volumes aus, und vergewissern Sie sich, dass in der Spalte Integrität für jedes Volume Fehlerfrei angezeigt wird, und dass in der Spalte Status für jedes Volume OK angezeigt wird.

Anhalten und Entladen des Servers

Vor dem Herunterfahren oder Neustarten eines Servers sollten Sie den Server anhalten und alle Clusterrollen wie virtuelle Computer, die auf dem Server ausgeführt werden, entladen (verschieben). Halten Sie gruppierte Server vor dem Offlineschalten zur Wartung immer an, und entladen Sie sie zuerst.

Stellen Sie mithilfe von Windows Admin Center eine Verbindung mit dem Cluster her, und wählen Sie dann im Cluster-Manager im Menü Tools die Option Compute > Server aus.
Wählen Sie Lagerbestand aus. Klicken Sie auf den Namen des Servers, der angehalten und entladen werden soll, und wählen Sie Anhalten aus. Daraufhin sollte folgende Aufforderung angezeigt werden:

Server für Wartung anhalten: Möchten Sie die Server wirklich anhalten? Dadurch werden Workloads, z. B. virtuelle Computer, auf andere Server im Cluster verschoben.
Wählen Sie Ja aus, um den Server anzuhalten und den Entladungsprozess zu initiieren. Der Status des Servers wird als Im Wartungsmodus, wird entladen angezeigt, und Rollen wie Hyper-V und virtuelle Computer beginnen sofort mit der Livemigration zu anderen Servern im Cluster. Dies kann einige Minuten dauern. Dem Server können erst dann Rollen hinzugefügt werden, wenn er fortgesetzt wird. Wenn der Entladevorgang abgeschlossen ist, wird der Serverstatus als In Wartung, Entladen abgeschlossen angezeigt. Das Betriebssystem führt eine automatische Sicherheitsüberprüfung durch, um dafür zu sorgen, dass der Vorgang sicher fortgesetzt werden kann. Wenn fehlerhafte Volumes vorhanden sind, hält er an und warnt Sie, dass der Vorgang nicht sicher fortgesetzt werden kann.

Herunterfahren des Servers

Nachdem das Entladen des Servers abgeschlossen ist, können Sie ihn problemlos zur Wartung herunterfahren oder neu starten.

Warnung

Wenn auf dem Server Azure Stack HCI, Version 20H2, Windows Server 2019 oder Windows Server 2016 ausgeführt wird, müssen Sie die Datenträger in den Wartungsmodus versetzen, bevor Sie den Server herunterfahren, und den Wartungsmodus für die Datenträger beenden, bevor Sie die Ausführung des Servers im Cluster fortsetzen.

Fortsetzen des Servers

Wenn Sie bereit dafür sind, dass der Server mit dem Hosting gruppierter Rollen und VMs wieder beginnen kann, schalten Sie den Server einfach wieder ein, warten Sie, bis er gestartet wurde, und setzen Sie den Server mit den folgenden Schritten fort.

Wählen Sie im Cluster-Manager im Menü Tools auf der linken Seite die Option Compute > Server aus.
Wählen Sie Lagerbestand aus. Klicken Sie auf den Namen des Servers, der fortgesetzt werden soll, und dann auf Fortsetzen.

Clusterrollen und VMs beginnen sofort mit der Livemigration zurück auf den Server. Dies kann einige Minuten dauern.

Abwarten der Neusynchronisierung des Speichers

Beim Fortsetzen des Servers müssen alle neuen Schreibvorgänge, die während der Nichtverfügbarkeit erfolgt sind, neu synchronisiert werden. Dies erfolgt automatisch mithilfe intelligenter Änderungsnachverfolgung. Es ist nicht erforderlich, dass alle Daten überprüft oder synchronisiert werden, lediglich die Änderungen. Dieser Prozess wird gedrosselt, um die Auswirkungen auf Produktionsworkloads zu mindern. Je nachdem, wie lange der Server angehalten wurde und wie viele neue Daten geschrieben wurden, kann es mehrere Minuten dauern, bis der Vorgang abgeschlossen ist.

Wichtig

Sie müssen warten, bis die Neusynchronisierung beendet ist, bevor Sie andere Server im Cluster offline schalten.

So überprüfen Sie, ob die speicher resync abgeschlossen ist:

Stellen Sie mithilfe von Windows Admin Center eine Verbindung mit dem Cluster her, und wählen Sie "Speichervolumes>" aus.
Wählen Sie Lagerbestand aus.
Überprüfen Sie die Statusspalte für jedes Volume. Wenn "OK" angezeigt wird, ist die Erneute Synchronisierung des Speichers abgeschlossen. Es ist jetzt sicher, andere Server im Cluster offline zu schalten.

Offlineschalten eines Servers mit PowerShell

Verwenden Sie die folgenden Verfahren, um einen Server in einem Failovercluster mithilfe von PowerShell ordnungsgemäß anzuhalten, zu entladen und fortzusetzen.

Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.

Um zu überprüfen, ob alle Ihre Volumes fehlerfrei sind, führen Sie das folgende Cmdlet als Administrator aus:

Get-VirtualDisk

Hier sehen Sie ein Beispiel für eine mögliche Ausgabe:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Vergewissern Sie sich, dass die Eigenschaft HealthStatus für jedes Volume Fehlerfrei ist, und die Eigenschaft OperationalStatus den Wert „OK“ hat.

Um dies mithilfe des Failovercluster-Managers zu erreichen, wechseln Sie zu Speicher>Datenträger.

Anhalten und Entladen des Servers

Führen Sie folgendes Cmdlet als Administrator aus, um den Server anzuhalten und zu entladen:

Suspend-ClusterNode -Drain

Navigieren Sie dazu im Failovercluster-Manager zu Knoten, klicken Sie mit der rechten Maustaste auf den Knoten, und wählen Sie dann Anhalten>Rollen nicht ausgleichen aus.

Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, werden durch das Anhalten und Ausgleichen des Servers auch die Datenträger des Servers in den Wartungsmodus versetzt. Wenn auf dem Server Azure Stack HCI, Version 20H2, Windows Server 2019 oder Windows Server 2016 ausgeführt wird, müssen Sie dies manuell durchführen (siehe nächster Schritt).

Versetzen der Datenträger in den Wartungsmodus

In Azure Stack HCI, Version 20H2, Windows Server 2019 und Windows Server 2016 gibt das Versetzen der Datenträger des Servers in den Wartungsmodus „Direkte Speicherplätze“ die Möglichkeit, Daten ordnungsgemäß zu leeren und zu committen. Das geschieht um sicherzustellen, dass das Herunterfahren des Servers keine Auswirkungen auf den Zustand der Anwendung hat. Sobald ein Datenträger in den Wartungsmodus wechselt, lässt er keine Schreibvorgänge mehr zu. Um die Dauer für die Neusynchronisierung des Speichers zu minimieren, empfehlen wir, die Datenträger unmittelbar vor dem Neustart in den Wartungsmodus zu versetzen und sie aus dem Wartungsmodus zu holen, sobald das System wieder hochgefahren ist.

Hinweis

Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, können Sie diesen Schritt überspringen. Die Datenträger werden nämlich automatisch in den Wartungsmodus versetzt, wenn der Server angehalten und ausgeglichen wird. Diese Betriebssysteme verfügen über ein differenziertes Reparaturfeature, das die Neusynchronisierung beschleunigt und weniger Auswirkungen auf die System- und Netzwerkressourcen hat, sodass Server- und Speicherwartung gemeinsam durchgeführt werden können.

Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 ausgeführt wird, führen Sie das folgende Cmdlet als Administrator aus:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Wenn auf dem Server Windows Server 2016 ausgeführt wird, verwenden Sie stattdessen die folgende Syntax:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Herunterfahren des Servers

Nachdem der Server das Entladen abgeschlossen hat, wird er in PowerShell und Failovercluster-Manager als Angehalten angezeigt.

Sie können den Server nun sicher herunterfahren oder neu starten, indem Sie die PowerShell-Cmdlets Stop-Computer oder Restart-Computer oder den Failovercluster-Manager verwenden.

Hinweis

Wenn Sie einen Get-VirtualDisk-Befehl auf Servern ausführen, die den Clusterdienst herunterfahren oder starten/beenden, wird der Betriebsstatus des Servers möglicherweise als „unvollständig“ oder „verschlechtert“ gemeldet, und in der Spalte „Integritätsstatus“ wird eventuell eine Warnung angezeigt. Dies ist normal und sollte keine Bedenken verursachen. Alle Ihre Volumes bleiben online und zugänglich.

Beenden des Wartungsmodus für die Datenträger

Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 oder Windows Server 2016 ausgeführt wird, müssen Sie den Speicherwartungsmodus auf den Datenträgern deaktivieren, bevor Sie den Server im Cluster fortsetzen. Um die Dauer für die Neusynchronisierung des Speichers zu minimieren, wird empfohlen, für diese den Wartungsmodus zu beenden, sobald das System wieder hochgefahren wurde.

Hinweis

Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, können Sie diesen Schritt überspringen. Für die Datenträger wird der Wartungsmodus nämlich automatisch beendet, wenn der Server fortgesetzt wird.

Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 ausgeführt wird, führen Sie das folgende Cmdlet als Administrator aus, um den Speicherwartungsmodus zu deaktivieren:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Wenn auf dem Server Windows Server 2016 ausgeführt wird, verwenden Sie stattdessen die folgende Syntax:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Fortsetzen des Servers

Setzen Sie den Server im Cluster fort. Um die gruppierten Rollen und VMs, die zuvor auf dem Server ausgeführt wurden, wieder zurückzuverschieben, verwenden Sie das optionale Flag -Failback:

Resume-ClusterNode –Failback Immediate

Navigieren Sie dazu im Failovercluster-Manager zu Knoten, klicken Sie mit der rechten Maustaste auf den Knoten, und wählen Sie dann Fortsetzen>Failback für Rollen ausführen aus.

Sobald der Server fortgesetzt wurde, wird er in PowerShell und dem Failovercluster-Manager als Aktiv angezeigt.

Abwarten der Neusynchronisierung des Speichers

Wenn der Server fortgesetzt wird, müssen Sie warten, bis die Neusynchronisierung beendet ist, bevor Sie andere Server im Cluster offline schalten.

Führen Sie folgendes Cmdlet als Administrator aus, um den Status zu überwachen:

Get-StorageJob

Wenn die Neusynchronisierung bereits abgeschlossen wurde, erhalten Sie keine Ausgabe.

Hier sehen Sie eine Beispielausgabe, die anzeigt, dass Neusynchronisierungs(Reparatur)aufträge noch ausgeführt werden:

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

In der Spalte BytesTotal wird angezeigt, wie viel Speicher neu synchronisiert werden muss. In der Spalte PercentComplete wird der Status angezeigt.

Warnung

Es ist nicht sicher, einen anderen Server offline zu schalten, bevor diese Reparaturaufträge abgeschlossen sind.

Während dieser Zeit werden Ihre Volumes unter HealthStatus weiterhin als Warnung angezeigt, was normal ist.

Wenn Sie beispielsweise das Cmdlet Get-VirtualDisk verwenden, während der Speicher neu synchronisiert wird, wird möglicherweise die folgende Ausgabe angezeigt:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Sobald die Aufträge abgeschlossen sind, vergewissern Sie sich, dass mit dem Cmdlet Get-VirtualDisk erneut, dass die Volumes als Fehlerfrei angezeigt werden. Hier ist eine Beispielausgabe angegeben:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Nun können andere Server im Cluster sicher angehalten und neu gestartet werden.

Nächste Schritte

Verwandte Informationen finden Sie außerdem unter:

Freigeben über

Wartungsverfahren für Failovercluster

Offlineschalten eines Servers über Windows Admin Center

Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.

Anhalten und Entladen des Servers

Herunterfahren des Servers

Fortsetzen des Servers

Abwarten der Neusynchronisierung des Speichers

Offlineschalten eines Servers mit PowerShell

Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.

Anhalten und Entladen des Servers

Versetzen der Datenträger in den Wartungsmodus

Herunterfahren des Servers

Beenden des Wartungsmodus für die Datenträger

Fortsetzen des Servers

Abwarten der Neusynchronisierung des Speichers

Nächste Schritte

Feedback

Zusätzliche Ressourcen