Felsöka nodfel som inte är klara och som följs av återställningar

Artikel
03/19/2025

Den här artikeln innehåller en guide för att felsöka och lösa problem med Nod som inte är redo i AKS-kluster (Azure Kubernetes Service). När en nod anger tillståndet "NotReady" kan den störa programmets funktioner och få den att sluta svara. Vanligtvis återställs noden automatiskt efter en kort period. Men för att förhindra återkommande problem och upprätthålla en stabil miljö är det viktigt att förstå de underliggande orsakerna till att kunna implementera effektiva lösningar.

Orsak

Det finns flera scenarier som kan orsaka ett "NotReady"-tillstånd:

API-serverns otillgänglighet. Detta gör att beredskapsavsökningen misslyckas. Detta förhindrar att podden ansluts till tjänsten så att trafiken inte längre vidarebefordras till poddinstansen.
Värdfel för virtuell dator (VM). Kontrollera följande informationskällor för att ta reda på om det inträffade fel på den virtuella datorns värd:
- AKS-diagnostik
- Azure-status
- Azure-meddelanden (för eventuella senaste avbrott eller underhållsperioder)

Åtgärd

Lös problemet så här:

Kör kubectl describe node <node-name> för att granska detaljerad information om nodens status. Leta efter eventuella felmeddelanden eller varningar som kan tyda på rotorsaken till problemet.
Kontrollera TILLGÄNGLIGHETen för API-servern genom att kubectl get apiservices köra kommandot . Kontrollera att beredskapsavsökningen är korrekt konfigurerad i YAML-distributionsfilen.
Kontrollera nodens nätverkskonfiguration för att kontrollera att det inte finns några anslutningsproblem.
Kontrollera nodens resursanvändning, till exempel CPU, minne och disk, för att identifiera potentiella begränsningar. Mer information finns i Övervaka kubernetes-klusterprestanda med containerinsikter

Ytterligare steg finns i Grundläggande felsökning av nodfel som inte är klara.

Prevention (Skydd)

Om du vill förhindra att det här problemet inträffar i framtiden vidtar du en eller flera av följande åtgärder:

Kontrollera att tjänstnivån är helt betald.
Minska antalet watch och get begäranden till API-servern.

Dela via

Felsöka nodfel som inte är klara och som följs av återställningar

Orsak

Åtgärd

Prevention (Skydd)

Feedback

Ytterligare resurser