Устранение неполадок с ошибками узла, за которыми следует восстановление
В этой статье приведено руководство по устранению неполадок и устранению проблем с узлами Служба Azure Kubernetes (AKS). Когда узел входит в состояние "Не готово", он может нарушить функциональные возможности приложения и привести к остановке ответа. Как правило, узел восстанавливается автоматически после короткого периода. Тем не менее, чтобы предотвратить повторяющиеся проблемы и поддерживать стабильную среду, важно понимать основные причины, позволяющие реализовать эффективные решения.
Причина
Существует несколько сценариев, которые могут привести к возникновению состояния "Не готово":
Недоступность сервера API. Это приводит к сбою пробы готовности. Это предотвращает присоединение pod к службе, чтобы трафик больше не перенаправлялся в экземпляр pod.
Ошибки узла виртуальной машины. Чтобы определить, произошли ли сбои узла виртуальной машины, проверьте следующие источники информации:
- AKS диагностика
- Состояние Azure
- Уведомления Azure (для всех последних сбоев или периодов обслуживания)
Решение
Проверьте доступность сервера API, выполнив kubectl get apiservices
команду. Убедитесь, что проба готовности правильно настроена в файле YAML развертывания.
Дополнительные инструкции см. в разделе "Основные проблемы с ошибками, не готовыми к работе с узлом".
Предотвращение
Чтобы предотвратить возникновение этой проблемы в будущем, выполните одно или несколько следующих действий:
- Убедитесь, что уровень служб полностью оплачивается.
- Уменьшите количество
watch
иget
запросы к серверу API.