Наблюдение
Azure CycleCloud поддерживает мониторинг внешних служб с помощью подключаемой архитектуры. Администраторы могут включить автоматический мониторинг этих систем, перейдя на страницу "Параметры " в меню пользователя в правом верхнем углу веб-интерфейса, дважды щелкнув элемент параметров CycleCloud и установив флажок "Включить мониторинг для служб CycleCloud".
Если этот параметр включен, поддерживаемые службы в каждом кластере будут автоматически регистрироваться в CycleCloud, что настроит мониторинг для этой службы.
Поддерживаемые службы
Каждая версия CycleCloud поставляется с поддержкой мониторинга Ganglia для сбора метрик производительности, таких как загрузка ЦП, памяти и пропускной способности. Если кластер настроен для использования Ganglia (по умолчанию в большинстве случаев), автоматический мониторинг будет работать до тех пор, пока порт 8652 открыт между CycleCloud и главным узлом кластера (запущенной службой gmetad).
Ganglia в CentOS/RHEL
Ганглия на CentOS и RHEL предоставляется EPEL. Azure CycleCloud настраивает и устанавливает EPEL и зависимости Ganglia по умолчанию.
Можно отказаться от использования EPEL, задав параметр cyclecloud.install_epel = false
в шаблоне кластера. Отказ от EPEL пропустит настройку мониторинга Ganglia. Это не повлияет на вычислительные функции вычислительного кластера, но приведет к тому, что данные будут собраны для представления отчетов кластера.
В информационных целях ниже приведены зависимости "клиента", установленные на узлах выполнения кластера, и зависимости "сервера", установленные на узлах главного или головного кластера.
# Ganglia client dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc pcre python python-libs systemd zlib
# Ganglia client dependencies provided by EPEL
yum -y install ganglia ganglia-gmond ganglia-gmond-python libconfuse
# Ganglia server dependencies from CentOS/RHEL base
yum -y install apr bash expat glibc libmemcached pcre rrdtool systemd zlib
# Ganglia server dependencies provided by EPEL
yum -y install ganglia ganglia-gmetad libconfuse
Если вы используете выпуск Grid Scheduling Edition of CycleCloud, мониторинг ядра grid будет автоматически настроен при запуске кластера ядра Grid Engine. Единственное требование заключается в том, что CycleCloud может SSH-подключение к узлу, на котором запущена служба qmaster, с помощью keypair, настроенной для кластера.
Azure Monitor
По состоянию на CycleCloud 8.0 метрики для кластера извлекаются из Azure Monitor вместо Ganglia. Это устраняет необходимость открытия порта 8652 входящего трафика на узлах.
Примечание
Даже кластеры, которые по-прежнему находятся в версии 7 и предварительно установлены Ganglia, получат свои метрики из Azure Monitor в CycleCloud 8.
Собираемые метрики:
- Percentage CPU
- Скорость чтения с диска
- Disk Write Bytes
- Сеть (входящий трафик)
- Сеть (исходящий трафик)
Он также позволяет сохранять данные журнала из кластеров CycleCloud в Log Analytics и создавать пользовательские панели мониторинга метрик. Дополнительные сведения о создании пользовательских панелей мониторинга метрик из Log Analytics для кластеров см. в разделе "Практическое руководство" и руководствах в документации по Azure Monitor.