Solución de problemas de errores de nodo no preparados seguidos de recuperaciones
Este artículo ayuda a solucionar problemas de escenarios en los que un nodo dentro de un clúster de Microsoft Azure Kubernetes Service (AKS) muestra el estado No listo del nodo, pero luego se recupera automáticamente en un estado correcto.
Síntomas
Observe que la aplicación deja de responder mientras el nodo informa de que tiene un estado No listo. Sin embargo, el nodo se recupera automáticamente y ahora busca un análisis de causa principal (RCA).
Causa
Entre las posibles causas de este problema se incluyen los siguientes escenarios:
El servidor de API no está disponible y usa un sondeo de preparación para la implementación.
Si un pod se está ejecutando pero no está listo, esa situación significa que se produce un error en el sondeo de preparación. Si se produce un error en el sondeo de preparación, el pod no está asociado al servicio y el tráfico no se reenvía a la instancia de pod.
Se producen errores de host de máquina virtual (VM). Para determinar si se han producido errores de host de máquina virtual, compruebe los siguientes orígenes de información:
- Diagnósticos de AKS
- Estado de Azure
- Notificaciones de Azure (para interrupciones o períodos de mantenimiento recientes)
Prevención
Para evitar que este problema se produzca en el futuro, realice una o varias de las siguientes acciones:
- Asegúrese de que el nivel de servicio se paga por completo.
- Reduzca el número de solicitudes y
get
al servidor dewatch
API. - Reemplace el grupo de nodos por un grupo de nodos correcto.
Más información
- Para conocer los pasos generales de solución de problemas, consulte Solución de problemas básica de errores de nodo no preparado.