Résoudre les problèmes liés aux échecs de nœud non prêts suivis des récupérations
Cet article fournit un guide pour résoudre les problèmes liés aux clusters Azure Kubernetes Service (AKS) et les résoudre. Lorsqu’un nœud entre dans un état « Non prêt », il peut perturber la fonctionnalité de l’application et l’empêcher de répondre. En règle générale, le nœud récupère automatiquement après une courte période. Toutefois, pour éviter les problèmes récurrents et maintenir un environnement stable, il est important de comprendre les causes sous-jacentes pour pouvoir implémenter des résolutions efficaces.
Cause
Plusieurs scénarios peuvent entraîner un état « Non prêt » :
Indisponibilité du serveur d’API. Cela provoque l’échec de la sonde de préparation. Cela empêche le pod d’être attaché au service afin que le trafic ne soit plus transféré à l’instance de pod.
Erreurs de l’hôte de machine virtuelle. Pour déterminer si des erreurs d’hôte de machine virtuelle se sont produites, vérifiez les sources d’informations suivantes :
- Diagnostics AKS
- Statut Azure
- Notifications Azure (pour toute panne ou période de maintenance récente)
Résolution
Vérifiez la disponibilité du serveur d’API en exécutant la kubectl get apiservices
commande. Vérifiez que la sonde de préparation est correctement configurée dans le fichier YAML de déploiement.
Pour plus d’informations, consultez La résolution des problèmes de base des échecs Node Not Ready.
Prévention
Pour empêcher ce problème de se produire à l’avenir, effectuez une ou plusieurs des actions suivantes :
- Assurez-vous que votre niveau de service est entièrement payé.
- Réduisez le nombre et
watch
get
les demandes adressées au serveur d’API.