Поделиться через


Оценка работоспособности кластера AKS

Этот материал входит в цикл статей. Начните с обзора.

Чтобы начать работу, оцените общую работоспособность кластера и сети.

Инструменты

Существует множество средств и функций, которые можно использовать для диагностики и решения проблем в кластере Служба Azure Kubernetes (AKS).

В портал Azure выберите ресурс кластера AKS. Эти средства и функции находятся в области навигации.

  • Диагностика и устранение проблем. Это средство позволяет выявлять и устранять проблемы в кластере.

  • Работоспособность ресурсов. Это средство позволяет диагностировать и получать поддержку проблем со службами, которые могут повлиять на ресурсы Azure. Это средство предоставляет сведения о текущем и прошлом состоянии работоспособности ресурсов.

  • Рекомендации помощника. Помощник по Azure выступает в качестве персонализированного облачного консультанта, который позволяет следовать рекомендациям по оптимизации развертываний Azure. Помощник можно использовать для анализа конфигурации ресурсов и телеметрии использования. Помощник предлагает решения, чтобы повысить эффективность затрат, производительность, надежность и безопасность.

  • Журналы. Используйте эту функцию для доступа к журналам и метрикам кластера, хранящимся в рабочей области Log Analytics . Вы можете отслеживать и анализировать журналы и метрики кластера, чтобы обеспечить аналитические сведения и улучшить устранение неполадок.

Используйте эти средства и функции, чтобы эффективно диагностировать и устранять проблемы, оптимизировать развертывание кластера AKS и отслеживать работоспособность и производительность ресурсов Azure.

Диагностика и решение проблем

Функция диагностики и решения проблем предоставляет комплексный набор средств для выявления и решения различных проблем, связанных с кластером. Выберите категорию устранения неполадок, которая наиболее актуальна для вашей проблемы.

Screenshot that shows the Diagnose and solve problems page.

Чтобы проверка работоспособности кластера, можно выбрать следующее:

  • Доступность и производительность уровня кластера и управления. Проверьте наличие проблем доступности или регулирования службы, влияющих на работоспособность кластера.
  • Подключение проблемы с доступностью. Проверьте наличие ошибок с разрешением системы доменных имен кластера (DNS) или если исходящий маршрут связи имеет проблемы с подключением.

Работоспособность ресурса

Используйте функцию работоспособности ресурсов для выявления и получения поддержки проблем с кластером и служб, которые могут повлиять на работоспособность кластера. Настройте оповещение о ресурсах, чтобы легко отслеживать работоспособность кластера. Функция работоспособности ресурсов предоставляет отчет о текущем и прошлом работоспособности кластера. Существует четыре состояния работоспособности:

  • Доступно: это состояние указывает на отсутствие событий, которые влияют на работоспособность кластера. Если кластер восстановился после незапланированного простоя за последние 24 часа, появится недавно разрешенное уведомление.

  • Недоступно: это состояние указывает на то, что обнаружена текущая платформа или неплатформенное событие, влияющее на работоспособность кластера.

  • Неизвестно: это состояние указывает, что функция не получила никаких сведений о ресурсе в течение более 10 минут. Обычно это состояние отображается при освобождении виртуальной машины. Это состояние не является окончательным указанием состояния ресурса, но это может быть полезной точкой для устранения неполадок.

  • Пониженный уровень: это состояние указывает на то, что производительность кластера снижается, но кластер по-прежнему доступен для использования.

На следующем снимка экрана показан обзор работоспособности ресурсов.

Screenshot that shows the AKS resource health overview.

Дополнительные сведения см. в обзоре работоспособности ресурсов Azure.

Помощник

Помощник предоставляет практические рекомендации, помогающие оптимизировать кластеры AKS для обеспечения надежности, безопасности, эффективности работы и производительности. Помощник можно использовать для упреждающего улучшения производительности кластера и предотвращения потенциальных проблем. Выберите рекомендацию для получения подробных сведений о том, как оптимизировать кластер.

Screenshot that shows the Advisor for AKS result with actions.

На следующем снимка экрана показаны ресурсы для выбранной рекомендации.

Screenshot that shows the Advisor for AKS result sample 2.Дополнительные сведения см. в обзоре Помощника.

Служба Log Analytics

Log Analytics предоставляет аналитические сведения о работоспособности кластера. Чтобы получить доступ к рабочей области Log Analytics, перейдите в кластер AKS и выберите "Журналы" в области навигации.

Вы можете выбрать стандартные запросы для анализа работоспособности кластера.

Screenshot that shows queries.

Используйте встроенные запросы для запроса журналов и метрик, собранных в рабочей области Log Analytics. В следующем списке описаны функции некоторых запросов в группах доступности, журналах контейнеров и диагностика категориях.

  • Доступность

    • Состояние готовности для каждого запроса узла : просмотрите количество всех узлов в кластере по состоянию готовности.

    • Вывод списка всех модулей pod с запросом на этап. Просмотрите количество всех модулей pod на этапе , например сбой, ожидание, неизвестность, выполнение или успешное выполнение.

  • Журналы контейнеров

    • Найдите значение в запросе таблицы журналов контейнеров: найдите строки в таблице ContainerLogs, где LogEntry имеет указанный строковый параметр.

    • Вывод списка журналов контейнеров на запрос пространства имен : просмотр журналов контейнеров из пространств имен в кластере.

  • Диагностика

    • Запрос журналов автомасштабирования кластера: запрос для журналов из автомасштабирования кластера. Этот запрос может предоставить сведения о том, почему кластер неожиданно масштабируется вверх или вниз.

    • Запрос к серверу API Kubernetes: запрос журналов журналов с сервера API Kubernetes.

    • Запрос инвентаризации изображений: вывод списка всех образов контейнеров и их состояния.

    • Чтение диска Prometheus в секунду на каждый запрос узла : просмотр метрик диска Prometheus считывается из пространства имен Kubernetes по умолчанию в виде диаграммы времени.

    • Экземпляры Среднего роста использования ЦП от запроса на прошлой неделе : показывает средний рост ЦП на экземпляр за прошлую неделю в порядке убывания.

Соавторы

Эта статья поддерживается корпорацией Майкрософт. Первоначально он был написан следующими участник.

Основные авторы:

Другие участник:

Чтобы просмотреть недоступные профили LinkedIn, войдите в LinkedIn.