Behandeln allgemeiner Fehler bei der automatischen Reparatur von Knoten
Wenn Azure Kubernetes Service (AKS) einen Knoten mit einem NotReady
Status für mehr als fünf Minuten erkennt, versucht er, den Knoten automatisch zu reparieren. Die automatische Reparatur von Knoten ist ein Best-Effort-Dienst. Es garantiert nicht, dass der Knoten in einem fehlerfreien Zustand wiederhergestellt werden kann. Weitere Informationen finden Sie im Prozess der automatischen Reparatur von Knoten.
Während des automatischen Reparaturprozesses des Knotens reboot
reimage
initiiert AKS und redeploy
Aktionen für Ihren fehlerhaften Knoten. Fehler können aufgrund verschiedener Ursachen auftreten, und Fehlercodes werden über Kubernetes-Ereignisse ermittelt. Sie können Kubernetes-Ereignisse verwenden, um den Status Ihres Knotens und die Aktionen zur automatischen Reparatur zu überwachen.
Dieser Artikel enthält potenzielle Ursachen und Lösungen für häufige Fehler bei der automatischen Reparatur von Knoten und beschreibt bewährte Methoden für die Überwachung des AutoReparaturprozesses des Knotens.
Voraussetzungen
Überprüfen Sie die folgenden Kubernetes-Ereignisse, um den Typ eines Fehlers für die automatische Reparatur eines Knotens zu identifizieren:
Ursache | Ereignisnachricht | Beschreibung |
---|---|---|
NodeRebootError | Fehler bei der automatischen Reparatur des Knotenneustarts aufgrund eines Vorgangsfehlers: [Fehlercode hier] | Wird ausgegeben, wenn bei der reboot Aktion ein Fehler auftritt. |
NodeReimageError | Fehler bei der automatischen Wiederherstellung der Knotenreparatur aufgrund eines Vorgangsfehlers: [Fehlercode hier] | Wird ausgegeben, wenn bei der reimage Aktion ein Fehler auftritt. |
NodeRedeployError | Fehler bei der automatischen Wiederherstellung der Knotenreparatur aufgrund eines Vorgangsfehlers: [Fehlercode hier] | Wird ausgegeben, wenn bei der redeploy Aktion ein Fehler auftritt. |
Notiz
Da sich Ihr Knoten bereits vor dem automatischen Reparaturvorgang in einem fehlerhaften Zustand befindet, wirken sich die Fehler bei der automatischen Reparatur in den meisten Fällen nicht auf Den Cluster oder Ihre Anwendungen aus. Wenn Fehler bei der automatischen Reparatur von Knoten auftreten, empfehlen wir, den Knoten zu reparieren, indem Sie die Anweisungen in der grundlegenden Problembehandlung bei Fehlern von Node Not Ready befolgen. Wenn Sie ihn nicht in einem Succeeded
Status wiederherstellen können und persistente Fehler von der automatischen Reparatur des Knotens angezeigt werden, wenden Sie sich an Azure-Support, um Hilfe zu erhalten.
Häufige Fehlermeldungen
Fehlercode | Ursache und Lösung |
---|---|
VMExtensionProvisioningError | Mindestens eine VM-Erweiterung (Virtual Machine) konnte auf dem virtuellen Computer nicht bereitgestellt werden. Weitere Informationen zu möglichen Fehlertypen und Problembehandlungsschritten finden Sie unter Problembehandlung des ERR_VHD_FILE_NOT_FOUND Fehlercodes (124). Um den genauen Bereitstellungsfehler der VM-Erweiterung auf Ihrem Knoten zu ermitteln, zeigen Sie Fehlerdetails im Azure-Portal an. |
InvalidParameter | Dieser Fehler tritt auf, wenn der Automatische Reparaturprozess des Knotens versucht, auf einen Knoten zuzugreifen, der nicht mehr vorhanden ist. |
scaleSetNameAndInstanceIDFromProviderID failed | Dieses Problem tritt auf, wenn der Knoten nicht ordnungsgemäß bereitgestellt wird. |
ManagedIdentityCredential-Authentifizierung fehlgeschlagen | Dieses Problem tritt auf, wenn der Knoten nicht ordnungsgemäß initialisiert wird. |
VMRedeploymentFailed | Dieser Fehler tritt auf, wenn Sie versuchen, den Knoten erneut bereitzustellen. In diesem Fall kann ihr Knotenpool einen fehlerhaften Zustand eingeben. Weitere Informationen zu potenziellen Ursachen und Problembehandlungsschritten finden Sie unter "Problembehandlung bei Azure Kubernetes-Dienstclustern oder Knoten in einem fehlerhaften Zustand". |
TooManyVMRedeploymentRequests | Dieser Fehler tritt auf, wenn Ihr Cluster den Grenzwert für anforderungen für die erneute Bereitstellung des virtuellen Computers überschreitet. Redeploy ist eine der Automatischen Reparaturaktionen des Knotens. Dieser Fehler bedeutet, dass die Aktion den redeploy Knoten nicht reparieren kann. Informationen zur Problembehandlung des Problems "Knoten nicht bereit" finden Sie unter "Grundlegende Problembehandlung bei Fehlern bei Knoten nicht bereit". |
OutboundConnectivityNotEnabledOnVMSS | Dieser Fehler tritt auf, wenn der Knoten oder die gesamte Skalierungsgruppe des virtuellen Computers keinen ausgehenden Zugriff aktiviert hat. Um dieses Problem zu beheben, aktivieren Sie sicheren ausgehenden Zugriff für Ihren Skalierungssatz mithilfe einer Methode, die für Ihre Anwendung am besten geeignet ist. Weitere Informationen finden Sie unter "OutboundConnectivityNotEnabledOnVM. Keine ausgehende Konnektivität für virtuelle Computer konfiguriert." |
Bewährte Methoden für die automatische Reparatur von Knoten
AKS speichert Kubernetes-Ereignisse standardmäßig aus der letzten Stunde. Es wird empfohlen, Containereinblicke zu aktivieren, damit Sie Ereignisse für bis zu 90 Tage speichern können. Sie können auch Ereignisse abfragen und Warnungen konfigurieren, um Fehler bei der automatischen Reparatur von Knoten schnell zu erkennen.
Die automatische Reparatur von Knoten ist ein Best-Effort-Dienst. Es garantiert nicht, dass Ihr Knoten in einem
Ready
Status wiederhergestellt werden kann. Es wird empfohlen, warnungen für Probleme mit Node Not Ready aktiv zu überwachen und festzulegen sowie diese Probleme selbst zu beheben und zu beheben. Weitere Informationen finden Sie unter grundlegende Problembehandlung bei Problemen mit Node Not Ready.
Kontaktieren Sie uns für Hilfe
Wenn Sie Fragen haben oder Hilfe mit Ihren Azure-Gutschriften benötigen, dann erstellen Sie beim Azure-Support eine Support-Anforderung oder fragen Sie den Azure Community-Support. Sie können auch Produktfeedback an die Azure Feedback Community senden.