Wartungsverfahren für Failovercluster
Gilt für: Azure Stack HCI, Versionen 22H2 und 21H2, Windows Server 2022, Windows Server 2019, Windows Server 2016
Wichtig
Azure Stack HCI ist jetzt Teil von Azure Local. Die Umbenennung der Produktdokumentation wird ausgeführt. Ältere Versionen von Azure Stack HCI, z. B. 22H2, verweisen jedoch weiterhin auf Azure Stack HCI und spiegeln die Namensänderung nicht wider. Weitere Informationen
In diesem Artikel wird vorausgesetzt, dass Sie einen physischen Server ausschalten müssen, um Wartungsarbeiten auszuführen, oder ihn aus einem anderen Grund neu starten müssen. Informationen zum Installieren von Updates in einem Azure Stack HCI-Cluster, ohne Server offline zu schalten, finden Sie unter Aktualisieren von Azure Stack HCI-Clustern.
Wenn Sie einen Server zur Wartung offline nehmen, müssen hierfür Teile des Speichers offline geschaltet werden, die von allen Servern in einem Failovercluster gemeinsam verwendet werden. Hierfür muss der Server angehalten werden, der offline geschaltet werden soll, die Datenträger des Servers müssen in den Wartungsmodus gesetzt werden, Clusterrollen und virtuelle Computer (VMs) müssen auf andere Server im Cluster verschoben werden, und es muss überprüft werden, ob alle Daten auf den anderen Servern im Cluster verfügbar sind. Durch diesen Vorgang wird sichergestellt, dass die Daten während des gesamten Wartungszeitraums sicher und zugänglich bleiben.
Sie können Windows Admin Center oder PowerShell verwenden, um einen Server zur Wartung offline zu schalten. In diesem Thema werden beide Methoden behandelt.
Offlineschalten eines Servers über Windows Admin Center
Die einfachste Möglichkeit, das Offlineschalten eines Servers vorzubereiten, ist die Verwendung des Windows Admin Centers.
Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.
Stellen Sie mithilfe des Windows Admin Centers eine Verbindung mit dem Server her, den Sie offline schalten möchten. Wählen Sie im Menü Tools die Option Speicher > Datenträger aus, und überprüfen Sie, ob in der Spalte Status für jeden virtuellen Datenträger Online angezeigt wird.
Wählen Sie dann Speicher > Volumes aus, und vergewissern Sie sich, dass in der Spalte Integrität für jedes Volume Fehlerfrei angezeigt wird, und dass in der Spalte Status für jedes Volume OK angezeigt wird.
Anhalten und Entladen des Servers
Vor dem Herunterfahren oder Neustarten eines Servers sollten Sie den Server anhalten und alle Clusterrollen wie virtuelle Computer, die auf dem Server ausgeführt werden, entladen (verschieben). Halten Sie gruppierte Server vor dem Offlineschalten zur Wartung immer an, und entladen Sie sie zuerst.
Stellen Sie mithilfe von Windows Admin Center eine Verbindung mit dem Cluster her, und wählen Sie dann im Cluster-Manager im Menü Tools die Option Compute > Server aus.
Wählen Sie Lagerbestand aus. Klicken Sie auf den Namen des Servers, der angehalten und entladen werden soll, und wählen Sie Anhalten aus. Daraufhin sollte folgende Aufforderung angezeigt werden:
Server für Wartung anhalten: Möchten Sie die Server wirklich anhalten? Dadurch werden Workloads, z. B. virtuelle Computer, auf andere Server im Cluster verschoben.
Wählen Sie Ja aus, um den Server anzuhalten und den Entladungsprozess zu initiieren. Der Status des Servers wird als Im Wartungsmodus, wird entladen angezeigt, und Rollen wie Hyper-V und virtuelle Computer beginnen sofort mit der Livemigration zu anderen Servern im Cluster. Dies kann einige Minuten dauern. Dem Server können erst dann Rollen hinzugefügt werden, wenn er fortgesetzt wird. Wenn der Entladevorgang abgeschlossen ist, wird der Serverstatus als In Wartung, Entladen abgeschlossen angezeigt. Das Betriebssystem führt eine automatische Sicherheitsüberprüfung durch, um dafür zu sorgen, dass der Vorgang sicher fortgesetzt werden kann. Wenn fehlerhafte Volumes vorhanden sind, hält er an und warnt Sie, dass der Vorgang nicht sicher fortgesetzt werden kann.
Herunterfahren des Servers
Nachdem das Entladen des Servers abgeschlossen ist, können Sie ihn problemlos zur Wartung herunterfahren oder neu starten.
Warnung
Wenn auf dem Server Azure Stack HCI, Version 20H2, Windows Server 2019 oder Windows Server 2016 ausgeführt wird, müssen Sie die Datenträger in den Wartungsmodus versetzen, bevor Sie den Server herunterfahren, und den Wartungsmodus für die Datenträger beenden, bevor Sie die Ausführung des Servers im Cluster fortsetzen.
Fortsetzen des Servers
Wenn Sie bereit dafür sind, dass der Server mit dem Hosting gruppierter Rollen und VMs wieder beginnen kann, schalten Sie den Server einfach wieder ein, warten Sie, bis er gestartet wurde, und setzen Sie den Server mit den folgenden Schritten fort.
Wählen Sie im Cluster-Manager im Menü Tools auf der linken Seite die Option Compute > Server aus.
Wählen Sie Lagerbestand aus. Klicken Sie auf den Namen des Servers, der fortgesetzt werden soll, und dann auf Fortsetzen.
Clusterrollen und VMs beginnen sofort mit der Livemigration zurück auf den Server. Dies kann einige Minuten dauern.
Abwarten der Neusynchronisierung des Speichers
Beim Fortsetzen des Servers müssen alle neuen Schreibvorgänge, die während der Nichtverfügbarkeit erfolgt sind, neu synchronisiert werden. Dies erfolgt automatisch mithilfe intelligenter Änderungsnachverfolgung. Es ist nicht erforderlich, dass alle Daten überprüft oder synchronisiert werden, lediglich die Änderungen. Dieser Prozess wird gedrosselt, um die Auswirkungen auf Produktionsworkloads zu mindern. Je nachdem, wie lange der Server angehalten wurde und wie viele neue Daten geschrieben wurden, kann es mehrere Minuten dauern, bis der Vorgang abgeschlossen ist.
Wichtig
Sie müssen warten, bis die Neusynchronisierung beendet ist, bevor Sie andere Server im Cluster offline schalten.
So überprüfen Sie, ob die speicher resync abgeschlossen ist:
- Stellen Sie mithilfe von Windows Admin Center eine Verbindung mit dem Cluster her, und wählen Sie "Speichervolumes>" aus.
- Wählen Sie Lagerbestand aus.
- Überprüfen Sie die Statusspalte für jedes Volume. Wenn "OK" angezeigt wird, ist die Erneute Synchronisierung des Speichers abgeschlossen. Es ist jetzt sicher, andere Server im Cluster offline zu schalten.
Offlineschalten eines Servers mit PowerShell
Verwenden Sie die folgenden Verfahren, um einen Server in einem Failovercluster mithilfe von PowerShell ordnungsgemäß anzuhalten, zu entladen und fortzusetzen.
Vergewissern Sie sich, dass es sicher ist, den Server offline zu schalten.
Um zu überprüfen, ob alle Ihre Volumes fehlerfrei sind, führen Sie das folgende Cmdlet als Administrator aus:
Get-VirtualDisk
Hier sehen Sie ein Beispiel für eine mögliche Ausgabe:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Vergewissern Sie sich, dass die Eigenschaft HealthStatus für jedes Volume Fehlerfrei ist, und die Eigenschaft OperationalStatus den Wert „OK“ hat.
Um dies mithilfe des Failovercluster-Managers zu erreichen, wechseln Sie zu Speicher>Datenträger.
Anhalten und Entladen des Servers
Führen Sie folgendes Cmdlet als Administrator aus, um den Server anzuhalten und zu entladen:
Suspend-ClusterNode -Drain
Navigieren Sie dazu im Failovercluster-Manager zu Knoten, klicken Sie mit der rechten Maustaste auf den Knoten, und wählen Sie dann Anhalten>Rollen nicht ausgleichen aus.
Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, werden durch das Anhalten und Ausgleichen des Servers auch die Datenträger des Servers in den Wartungsmodus versetzt. Wenn auf dem Server Azure Stack HCI, Version 20H2, Windows Server 2019 oder Windows Server 2016 ausgeführt wird, müssen Sie dies manuell durchführen (siehe nächster Schritt).
Versetzen der Datenträger in den Wartungsmodus
In Azure Stack HCI, Version 20H2, Windows Server 2019 und Windows Server 2016 gibt das Versetzen der Datenträger des Servers in den Wartungsmodus „Direkte Speicherplätze“ die Möglichkeit, Daten ordnungsgemäß zu leeren und zu committen. Das geschieht um sicherzustellen, dass das Herunterfahren des Servers keine Auswirkungen auf den Zustand der Anwendung hat. Sobald ein Datenträger in den Wartungsmodus wechselt, lässt er keine Schreibvorgänge mehr zu. Um die Dauer für die Neusynchronisierung des Speichers zu minimieren, empfehlen wir, die Datenträger unmittelbar vor dem Neustart in den Wartungsmodus zu versetzen und sie aus dem Wartungsmodus zu holen, sobald das System wieder hochgefahren ist.
Hinweis
Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, können Sie diesen Schritt überspringen. Die Datenträger werden nämlich automatisch in den Wartungsmodus versetzt, wenn der Server angehalten und ausgeglichen wird. Diese Betriebssysteme verfügen über ein differenziertes Reparaturfeature, das die Neusynchronisierung beschleunigt und weniger Auswirkungen auf die System- und Netzwerkressourcen hat, sodass Server- und Speicherwartung gemeinsam durchgeführt werden können.
Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 ausgeführt wird, führen Sie das folgende Cmdlet als Administrator aus:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Wenn auf dem Server Windows Server 2016 ausgeführt wird, verwenden Sie stattdessen die folgende Syntax:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Herunterfahren des Servers
Nachdem der Server das Entladen abgeschlossen hat, wird er in PowerShell und Failovercluster-Manager als Angehalten angezeigt.
Sie können den Server nun sicher herunterfahren oder neu starten, indem Sie die PowerShell-Cmdlets Stop-Computer
oder Restart-Computer
oder den Failovercluster-Manager verwenden.
Hinweis
Wenn Sie einen Get-VirtualDisk
-Befehl auf Servern ausführen, die den Clusterdienst herunterfahren oder starten/beenden, wird der Betriebsstatus des Servers möglicherweise als „unvollständig“ oder „verschlechtert“ gemeldet, und in der Spalte „Integritätsstatus“ wird eventuell eine Warnung angezeigt. Dies ist normal und sollte keine Bedenken verursachen. Alle Ihre Volumes bleiben online und zugänglich.
Beenden des Wartungsmodus für die Datenträger
Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 oder Windows Server 2016 ausgeführt wird, müssen Sie den Speicherwartungsmodus auf den Datenträgern deaktivieren, bevor Sie den Server im Cluster fortsetzen. Um die Dauer für die Neusynchronisierung des Speichers zu minimieren, wird empfohlen, für diese den Wartungsmodus zu beenden, sobald das System wieder hochgefahren wurde.
Hinweis
Wenn auf dem Server Azure Stack HCI, Version 21H2 oder Windows Server 2022 ausgeführt wird, können Sie diesen Schritt überspringen. Für die Datenträger wird der Wartungsmodus nämlich automatisch beendet, wenn der Server fortgesetzt wird.
Wenn auf dem Server Windows Server 2019 oder Azure Stack HCI, Version 20H2 ausgeführt wird, führen Sie das folgende Cmdlet als Administrator aus, um den Speicherwartungsmodus zu deaktivieren:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Wenn auf dem Server Windows Server 2016 ausgeführt wird, verwenden Sie stattdessen die folgende Syntax:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Fortsetzen des Servers
Setzen Sie den Server im Cluster fort. Um die gruppierten Rollen und VMs, die zuvor auf dem Server ausgeführt wurden, wieder zurückzuverschieben, verwenden Sie das optionale Flag -Failback:
Resume-ClusterNode –Failback Immediate
Navigieren Sie dazu im Failovercluster-Manager zu Knoten, klicken Sie mit der rechten Maustaste auf den Knoten, und wählen Sie dann Fortsetzen>Failback für Rollen ausführen aus.
Sobald der Server fortgesetzt wurde, wird er in PowerShell und dem Failovercluster-Manager als Aktiv angezeigt.
Abwarten der Neusynchronisierung des Speichers
Wenn der Server fortgesetzt wird, müssen Sie warten, bis die Neusynchronisierung beendet ist, bevor Sie andere Server im Cluster offline schalten.
Führen Sie folgendes Cmdlet als Administrator aus, um den Status zu überwachen:
Get-StorageJob
Wenn die Neusynchronisierung bereits abgeschlossen wurde, erhalten Sie keine Ausgabe.
Hier sehen Sie eine Beispielausgabe, die anzeigt, dass Neusynchronisierungs(Reparatur)aufträge noch ausgeführt werden:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
In der Spalte BytesTotal wird angezeigt, wie viel Speicher neu synchronisiert werden muss. In der Spalte PercentComplete wird der Status angezeigt.
Warnung
Es ist nicht sicher, einen anderen Server offline zu schalten, bevor diese Reparaturaufträge abgeschlossen sind.
Während dieser Zeit werden Ihre Volumes unter HealthStatus weiterhin als Warnung angezeigt, was normal ist.
Wenn Sie beispielsweise das Cmdlet Get-VirtualDisk
verwenden, während der Speicher neu synchronisiert wird, wird möglicherweise die folgende Ausgabe angezeigt:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Sobald die Aufträge abgeschlossen sind, vergewissern Sie sich, dass mit dem Cmdlet Get-VirtualDisk
erneut, dass die Volumes als Fehlerfrei angezeigt werden. Hier ist eine Beispielausgabe angegeben:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Nun können andere Server im Cluster sicher angehalten und neu gestartet werden.
Nächste Schritte
Verwandte Informationen finden Sie außerdem unter: