Felsöka nodfel som inte är klara och som följs av återställningar
Den här artikeln innehåller en guide för att felsöka och lösa problem med Nod som inte är redo i AKS-kluster (Azure Kubernetes Service). När en nod anger tillståndet "NotReady" kan den störa programmets funktioner och få den att sluta svara. Vanligtvis återställs noden automatiskt efter en kort period. Men för att förhindra återkommande problem och upprätthålla en stabil miljö är det viktigt att förstå de underliggande orsakerna till att kunna implementera effektiva lösningar.
Orsak
Det finns flera scenarier som kan orsaka ett "NotReady"-tillstånd:
API-serverns otillgänglighet. Detta gör att beredskapsavsökningen misslyckas. Detta förhindrar att podden ansluts till tjänsten så att trafiken inte längre vidarebefordras till poddinstansen.
Värdfel för virtuell dator (VM). Kontrollera följande informationskällor för att ta reda på om det inträffade fel på den virtuella datorns värd:
- AKS-diagnostik
- Azure-status
- Azure-meddelanden (för eventuella senaste avbrott eller underhållsperioder)
Åtgärd
Lös problemet så här:
- Kör
kubectl describe node <node-name>
för att granska detaljerad information om nodens status. Leta efter eventuella felmeddelanden eller varningar som kan tyda på rotorsaken till problemet. - Kontrollera TILLGÄNGLIGHETen för API-servern genom att
kubectl get apiservices
köra kommandot . Kontrollera att beredskapsavsökningen är korrekt konfigurerad i YAML-distributionsfilen. - Kontrollera nodens nätverkskonfiguration för att kontrollera att det inte finns några anslutningsproblem.
- Kontrollera nodens resursanvändning, till exempel CPU, minne och disk, för att identifiera potentiella begränsningar. Mer information finns i Övervaka kubernetes-klusterprestanda med containerinsikter
Ytterligare steg finns i Grundläggande felsökning av nodfel som inte är klara.
Prevention (Skydd)
Om du vill förhindra att det här problemet inträffar i framtiden vidtar du en eller flera av följande åtgärder:
- Kontrollera att tjänstnivån är helt betald.
- Minska antalet
watch
ochget
begäranden till API-servern.