Solución de problemas de errores de nodo no preparados seguidos de recuperaciones
En este artículo se proporciona una guía para solucionar problemas de "Node Not Ready" en clústeres de Azure Kubernetes Service (AKS). Cuando un nodo entra en un estado "No listo", puede interrumpir la funcionalidad de la aplicación y hacer que deje de responder. Normalmente, el nodo se recupera automáticamente después de un breve período. Sin embargo, para evitar problemas periódicos y mantener un entorno estable, es importante comprender las causas subyacentes para poder implementar resoluciones eficaces.
Causa
Hay varios escenarios que podrían provocar que se produzca un estado "No listo":
Falta de disponibilidad del servidor de API. Esto hace que se produzca un error en el sondeo de preparación. Esto impide que el pod se adjunte al servicio para que el tráfico ya no se reenvíe a la instancia del pod.
Errores de host de máquina virtual (VM). Para determinar si se han producido errores de host de máquina virtual, compruebe los siguientes orígenes de información:
- Diagnósticos de AKS
- Estado de Azure
- Notificaciones de Azure (para interrupciones o períodos de mantenimiento recientes)
Solución
Para comprobar la disponibilidad del servidor de API, ejecute el kubectl get apiservices
comando . Asegúrese de que el sondeo de preparación está configurado correctamente en el archivo YAML de implementación.
Para obtener más pasos, consulte Solución de problemas básicas de errores de nodo no preparado.
Prevención
Para evitar que este problema se produzca en el futuro, realice una o varias de las siguientes acciones:
- Asegúrese de que el nivel de servicio se paga por completo.
- Reduzca el número de solicitudes y
get
al servidor dewatch
API.