Solución de problemas de errores de nodo no preparados seguidos de recuperaciones

Artículo
12/11/2024

En este artículo se proporciona una guía para solucionar problemas de "Node Not Ready" en clústeres de Azure Kubernetes Service (AKS). Cuando un nodo entra en un estado "No listo", puede interrumpir la funcionalidad de la aplicación y hacer que deje de responder. Normalmente, el nodo se recupera automáticamente después de un breve período. Sin embargo, para evitar problemas periódicos y mantener un entorno estable, es importante comprender las causas subyacentes para poder implementar resoluciones eficaces.

Causa

Hay varios escenarios que podrían provocar que se produzca un estado "No listo":

Falta de disponibilidad del servidor de API. Esto hace que se produzca un error en el sondeo de preparación. Esto impide que el pod se adjunte al servicio para que el tráfico ya no se reenvíe a la instancia del pod.
Errores de host de máquina virtual (VM). Para determinar si se han producido errores de host de máquina virtual, compruebe los siguientes orígenes de información:
- Diagnósticos de AKS
- Estado de Azure
- Notificaciones de Azure (para interrupciones o períodos de mantenimiento recientes)

Solución

Para comprobar la disponibilidad del servidor de API, ejecute el kubectl get apiservices comando . Asegúrese de que el sondeo de preparación está configurado correctamente en el archivo YAML de implementación.

Para obtener más pasos, consulte Solución de problemas básicas de errores de nodo no preparado.

Prevención

Para evitar que este problema se produzca en el futuro, realice una o varias de las siguientes acciones:

Asegúrese de que el nivel de servicio se paga por completo.
Reduzca el número de solicitudes y get al servidor de watch API.

Compartir a través de

Solución de problemas de errores de nodo no preparados seguidos de recuperaciones

Causa

Solución

Prevención

Comentarios

Recursos adicionales