Freigeben über


Reparieren eines Knotens in Azure Local, Version 23H2

Gilt für: Azure Local, Version 23H2

In diesem Artikel wird beschrieben, wie Sie einen Knoten in Ihrer lokalen Azure-Instanz reparieren. In diesem Artikel wird jeder Server als Knoten bezeichnet.

Informationen zum Reparieren von Knoten

Azure Local ist ein hyperkonvergiertes System, mit dem Sie Knoten aus vorhandenen Systemen reparieren können. Möglicherweise müssen Sie einen Knoten in einem System reparieren, wenn ein Hardwarefehler auftritt.

Bevor Sie einen Knoten reparieren, stellen Sie sicher, dass Sie mit Ihrem Lösungsanbieter überprüfen, welche Komponenten auf dem Knoten Feldersatzeinheiten (FRUs) sind, die Sie selbst ersetzen können und welche Komponenten einen Techniker ersetzen müssen.

Teile, die Hot Swap unterstützen, erfordern in der Regel keine Erneutes Abbilden des Knotens im Gegensatz zu den nicht hot-swappablen Komponenten wie motherboard do. Wenden Sie sich an den Hardwarehersteller, um zu ermitteln, welche Komponentenersetzungen erforderlich wären, um den Knoten neu zu abbilden. Weitere Informationen finden Sie unter Komponentenersetzung.

Reparaturknotenworkflow

Das folgende Flussdiagramm zeigt den gesamten Prozess zum Reparieren eines Knotens.

Diagramm, das den Reparaturknotenprozess veranschaulicht.

*Knoten befindet sich möglicherweise nicht in einem Zustand, in dem das Herunterfahren möglich oder erforderlich ist*

Führen Sie die folgenden allgemeinen Schritte aus, um einen vorhandenen Knoten zu reparieren:

  1. Wenn möglich, beenden Sie den Knoten, den Sie reparieren möchten. Je nach Status des Knotens ist ein Herunterfahren möglicherweise nicht möglich oder erforderlich.

  2. Erstellen Sie ein Erneutes Abbild des Knotens, der repariert werden muss.

  3. Führen Sie den Reparaturknotenvorgang aus. Das Azure Stack HCI-Betriebssystem, Treiber und Firmware werden im Rahmen des Reparaturvorgangs aktualisiert.

    Der Speicher wird automatisch auf dem umgeimageten Knoten neu ausgeglichen. Die Speicherumwogenierung ist ein Vorgang mit niedriger Priorität, der je nach Anzahl der Knoten und des verwendeten Speichers mehrere Tage lang ausgeführt werden kann.

Unterstützte Szenarios

Durch reparieren eines Knotens wird ein Knoten neu erstellt und mit dem vorherigen Namen und der vorherigen Konfiguration wieder in das System zurückversendet.

Durch das Reparieren eines einzelnen Knotens wird eine erneute Bereitstellung mit der Option zum Speichern der Datenvolumes erzielt. Nur das Systemvolume wird während der Bereitstellung gelöscht und neu bereitgestellt.

Wichtig

Stellen Sie sicher, dass Sie immer Über Sicherungen für Ihre Workloads verfügen und nicht nur auf die Systemresilienz angewiesen sind. Dies ist insbesondere in Szenarien mit einem einzigen Knoten von entscheidender Bedeutung.

Resilienzeinstellungen

In dieser Version werden für einen Reparaturknotenvorgang bestimmte Aufgaben nicht auf den Workloadvolumes ausgeführt, die Sie nach der Bereitstellung erstellt haben. Bei einem Reparaturknotenvorgang werden nur die erforderlichen Infrastrukturvolumes und die Workloadvolumes als freigegebene Clustervolumes (Cluster Shared Volumes, CSVs) wiederhergestellt und angezeigt.

Die anderen Workloadvolumes, die Sie nach der Bereitstellung erstellt haben, bleiben erhalten, und Sie können diese Volumes ermitteln, indem Sie das Get-VirtualDisk Cmdlet ausführen. Sie müssen das Volume manuell entsperren (wenn das Volume BitLocker aktiviert ist), und eine CSV -Datei (falls erforderlich) erstellen.

Hardwareanforderungen

Beim Reparieren eines Knotens überprüft das System die Hardware des neuen, eingehenden Knotens und stellt sicher, dass der Knoten die Hardwareanforderungen erfüllt, bevor er dem System hinzugefügt wird.

Komponente Complianceüberprüfung
CPU Überprüfen Sie, ob der neue Knoten dieselbe Anzahl oder mehr CPU-Kerne aufweist. Wenn die CPU-Kerne auf dem eingehenden Knoten diese Anforderung nicht erfüllen, wird eine Warnung angezeigt. Der Vorgang ist jedoch zulässig.
Arbeitsspeicher Überprüfen Sie, ob der neue Knoten dieselbe Menge oder mehr Arbeitsspeicher installiert hat. Wenn der Speicher auf dem eingehenden Knoten diese Anforderung nicht erfüllt, wird eine Warnung angezeigt. Der Vorgang ist jedoch zulässig.
Laufwerke Überprüfen Sie, ob der neue Knoten dieselbe Anzahl von Datenlaufwerken für Speicherplätze Direct verfügbar ist. Wenn die Anzahl der Laufwerke auf dem eingehenden Knoten diese Anforderung nicht erfüllt, wird ein Fehler gemeldet, und der Vorgang wird blockiert.

Knotenersetzung

Sie können den gesamten Knoten ersetzen:

  • Bei einem neuen Knoten mit einer anderen Seriennummer als dem alten Knoten.
  • Mit dem aktuellen Knoten nach dem Erneuten Abbilden.

Die folgenden Szenarien werden während der Knotenersetzung unterstützt:

Node Datenträger Unterstützt
Neuer Knoten Neue Datenträger Ja
Neuer Knoten Aktuelle Datenträger Ja
Aktueller Knoten (umimaged) Aktuelle Datenträger neu formatiert ** No
Aktueller Knoten (umimaged) Neue Datenträger Ja
Aktueller Knoten (umimaged) Aktuelle Datenträger Ja

**Datenträger, die von Speicherplätze Direct verwendet wurden, erfordern eine ordnungsgemäße Reinigung. Die Neuformatierung reicht nicht aus. Erfahren Sie, wie Sie Laufwerke bereinigen.

Wichtig

Wenn Sie eine Komponente während der Knotenreparatur ersetzen, müssen Sie keine Datenlaufwerke ersetzen oder zurücksetzen. Wenn Sie ein Laufwerk ersetzen oder zurücksetzen, wird das Laufwerk nicht erkannt, sobald der Knoten mit dem System verknüpft ist.

Komponentenaustausch

In Ihrer lokalen Azure-Instanz enthalten nicht austauschbare Komponenten die folgenden Elemente:

  • Hauptplatine/Baseboard-Verwaltungscontroller (BMC)/Grafikkarte
  • Datenträgercontroller/Hostbusadapter (HBA)/Backplace
  • Netzwerkadapter
  • Grafikverarbeitungseinheit
  • Datenlaufwerke (Laufwerke, die den Austausch bei laufendem Betrieb nicht unterstützen, z. B. PCI-e-Add-In-Karten)

Die tatsächlichen Austauschschritte für Nicht-Hot-Swappable-Komponenten variieren je nach Originalgerätehersteller (OEM)-Hardwareanbieter. Lesen Sie die Dokumentation Ihres OEM-Herstellers, wenn eine Knotenreparatur für nicht austauschbare Komponenten erforderlich ist.

Voraussetzungen

Bevor Sie einen Knoten reparieren, müssen Sie folgendes sicherstellen:

  • AzureStackLCMUser ist in Active Directory aktiv. Weitere Informationen finden Sie unter Vorbereiten des Active Directory.
  • Angemeldet als AzureStackLCMUser oder ein anderer Benutzer mit entsprechenden Berechtigungen.
  • Die Anmeldeinformationen für die AzureStackLCMUser nicht geändert wurden.

Reparieren eines Knotens

In diesem Abschnitt wird beschrieben, wie Sie einen Knoten mithilfe von PowerShell reparieren, den Status des Repair-Server Vorgangs überwachen und problembehandlungen, falls Probleme auftreten.

Stellen Sie sicher, dass Sie die Voraussetzungen überprüft haben.

Führen Sie die folgenden Schritte auf dem Knoten aus, den Sie reparieren möchten.

  1. Installieren Sie das Betriebssystem und die erforderlichen Treiber. Führen Sie die Schritte unter Installieren des Azure Stack HCI-Betriebssystems, Version 23H2, aus.

    Hinweis

    Wenn Sie Ihre lokale Azure-Instanz mit benutzerdefinierten Speicher-IPs bereitgestellt haben, müssen Sie IPs manuell den Speichernetzwerkadaptern zuweisen, nachdem der Knoten repariert wurde.

  2. Registrieren Sie den Knoten mit Arc. Führen Sie die Schritte unter "Mit Arc registrieren" aus, und richten Sie Berechtigungen ein.

    Hinweis

    Sie müssen dieselben Parameter wie die vorhandenen Knoten verwenden, um sich bei Arc zu registrieren. Beispiel: Ressourcengruppenname, Region, Abonnement und Mandant.

  3. Weisen Sie dem reparierten Knoten die folgenden Berechtigungen zu:

Führen Sie diese Schritte auf einem anderen Knoten aus, der Mitglied derselben lokalen Azure-Instanz ist.

  1. Bevor Sie den Knoten hinzufügen, müssen Sie ein aktualisiertes Authentifizierungstoken abrufen. Führen Sie den folgenden Befehl aus:

     Update-AuthenticationToken
    
  2. Wenn Sie eine Version vor 2405.3 ausführen, müssen Sie den folgenden Befehl ausführen, um widersprüchliche Dateien zu bereinigen:

    Get-ChildItem -Path "$env:SystemDrive\NugetStore" -Exclude Microsoft.AzureStack.Solution.LCMControllerWinService*,Microsoft.AzureStack.Role.Deployment.Service* | Remove-Item -Recurse -Force
    
  3. Melden Sie sich beim Knoten an, der bereits Mitglied des Systems ist, mit den Domänenbenutzeranmeldeinformationen, die Sie während der Bereitstellung des Systems angegeben haben. Führen Sie den folgenden Befehl aus, um den eingehenden Knoten zu reparieren:

    $Cred = Get-Credential 
    Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
    

    Hinweis

    Der Knotenname muss der NetBIOS-Name sein.

  4. Notieren Sie sich die Vorgangs-ID als Ausgabe des Repair-Server Befehls. Sie verwenden dies später, um den Fortschritt des Repair-Server Vorgangs zu überwachen.

Überwachen des Vorgangsfortschritts

Führen Sie die folgenden Schritte aus, um den Fortschritt des Vorgangs zum Hinzufügen von Knoten zu überwachen:

  1. Führen Sie das folgende Cmdlet aus, und geben Sie die Vorgangs-ID aus dem vorherigen Schritt an.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. Nach Abschluss des Vorgangs wird der Rebalancing-Auftrag für den Hintergrundspeicher weiterhin ausgeführt. Warten Sie, bis der Speicher-Neuausgleichsauftrag abgeschlossen ist. Verwenden Sie das folgende Cmdlet, um den Fortschritt dieses Speicherrebalancingauftrags zu überprüfen:

    Get-VirtualDisk|Get-StorageJob
    

    Wenn der Speicherrückgewichtungsauftrag abgeschlossen ist, gibt das Cmdlet keine Ausgabe zurück.

Wiederherstellungsszenarien

Die folgenden Wiederherstellungsszenarien und die empfohlenen Gegenmaßnahmen werden zur Reparatur eines Knotens tabuliert:

Beschreibung des Szenarios Abmilderung Unterstützt?
Fehler beim Reparaturknotenvorgang. Um den Vorgang abzuschließen, untersuchen Sie den Fehler.
Führen Sie den fehlgeschlagenen Vorgang mithilfe von Add-Server -Rerun.
Ja
Der Reparaturknotenvorgang war teilweise erfolgreich, musste aber mit einer Neuinstallation des Betriebssystems beginnen. In diesem Szenario hat der Orchestrator (auch als Lifecycle Manager bezeichnet) seinen Wissensspeicher bereits mit dem neuen Knoten aktualisiert. Verwenden Sie das Reparaturknotenszenario. Ja

Problembehandlung

Wenn beim Reparieren eines Knotens Fehler oder Fehler auftreten, können Sie die Ausgabe der Fehler in einer Protokolldatei erfassen.

  • Melden Sie sich mit den Domänenbenutzeranmeldeinformationen an, die Sie während der Bereitstellung des Systems angegeben haben. Erfassen Sie das Problem in den Protokolldateien.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • Verwenden Sie das folgende Cmdlet, um den fehlgeschlagenen Vorgang erneut auszuführen:

    Repair-Server -Rerun
    

Nächste Schritte

Erfahren Sie mehr darüber , wie Sie einen Knoten hinzufügen.