Поделиться через


Устранение неполадок с ошибками узла, за которыми следует восстановление

В этой статье приведено руководство по устранению неполадок и устранению проблем с узлами Служба Azure Kubernetes (AKS). Когда узел входит в состояние "Не готово", он может нарушить функциональные возможности приложения и привести к остановке ответа. Как правило, узел восстанавливается автоматически после короткого периода. Тем не менее, чтобы предотвратить повторяющиеся проблемы и поддерживать стабильную среду, важно понимать основные причины, позволяющие реализовать эффективные решения.

Причина

Существует несколько сценариев, которые могут привести к возникновению состояния "Не готово":

  • Недоступность сервера API. Это приводит к сбою пробы готовности. Это предотвращает присоединение pod к службе, чтобы трафик больше не перенаправлялся в экземпляр pod.

  • Ошибки узла виртуальной машины. Чтобы определить, произошли ли сбои узла виртуальной машины, проверьте следующие источники информации:

Решение

Проверьте доступность сервера API, выполнив kubectl get apiservices команду. Убедитесь, что проба готовности правильно настроена в файле YAML развертывания.

Дополнительные инструкции см. в разделе "Основные проблемы с ошибками, не готовыми к работе с узлом".

Предотвращение

Чтобы предотвратить возникновение этой проблемы в будущем, выполните одно или несколько следующих действий:

  • Убедитесь, что уровень служб полностью оплачивается.
  • Уменьшите количество watch и get запросы к серверу API.