Compartir a través de


Solución de problemas de errores de nodo no preparados seguidos de recuperaciones

Este artículo ayuda a solucionar problemas de escenarios en los que un nodo dentro de un clúster de Microsoft Azure Kubernetes Service (AKS) muestra el estado No listo del nodo, pero luego se recupera automáticamente en un estado correcto.

Síntomas

Observe que la aplicación deja de responder mientras el nodo informa de que tiene un estado No listo. Sin embargo, el nodo se recupera automáticamente y ahora busca un análisis de causa principal (RCA).

Causa

Entre las posibles causas de este problema se incluyen los siguientes escenarios:

  • El servidor de API no está disponible y usa un sondeo de preparación para la implementación.

    Si un pod se está ejecutando pero no está listo, esa situación significa que se produce un error en el sondeo de preparación. Si se produce un error en el sondeo de preparación, el pod no está asociado al servicio y el tráfico no se reenvía a la instancia de pod.

  • Se producen errores de host de máquina virtual (VM). Para determinar si se han producido errores de host de máquina virtual, compruebe los siguientes orígenes de información:

Prevención

Para evitar que este problema se produzca en el futuro, realice una o varias de las siguientes acciones:

  • Asegúrese de que el nivel de servicio se paga por completo.
  • Reduzca el número de solicitudes y get al servidor de watch API.
  • Reemplace el grupo de nodos por un grupo de nodos correcto.

Más información