Поделиться через


Мониторинг одной локальной системы Azure с помощью Insights

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье описывается, как использовать Аналитику для мониторинга одной локальной системы Azure. Сведения о нескольких локальных системах Azure см. в статье "Мониторинг нескольких локальных систем Azure" с помощью Аналитики.

Аналитика — это функция Azure Monitor, которая быстро запускает мониторинг локальной системы Azure. Вы можете просматривать ключевые метрики, работоспособности и использования, касающиеся кластера, узлов, виртуальных машин и хранилища.

Посмотрите ознакомительное видео по Инсайтам для Azure Local.

Льготы

Аналитика для Azure Local предлагает следующие преимущества:

  • Управляется Azure. Управление службой Insights осуществляется через Azure, а доступ к ней обеспечивается через портал Azure, что гарантирует её постоянную актуальность. Нет необходимости в настройке базы данных или специального программного обеспечения.

  • Масштабируемость. Insights может загружать более 400 наборов данных о кластерах по нескольким подпискам одновременно. Нет ограничений на кластер, домен или физическое расположение.

  • Возможность настройки. Опыт использования Insight построен на шаблонах рабочих книг Azure Monitor. Это позволяет изменять представления и запросы, изменять или задавать пороговые значения, которые соответствуют определенным ограничениям, а затем сохранять эти настройки в книге. Затем вы можете закрепить диаграммы в рабочих книгах на панели мониторинга Azure.

Предварительные условия

Ниже приведены предварительные требования к использованию Insights для Azure Local:

  • У вас должен быть доступ к локальной системе Azure, развернутой и зарегистрированной.

  • Управляемая идентификация для ресурса Azure должна быть активирована. Дополнительные сведения см. в статье "Включено расширенное управление".

Включить инсайты

Функция Enabling Insights помогает отслеживать все локальные системы Azure, которые в данный момент связаны с рабочей областью Log Analytics, предоставляя полезные метрики работоспособности. Аналитика устанавливает агент Azure Monitor и помогает настроить правила сбора данных (DCR) для мониторинга локальной системы Azure.

Чтобы включить аналитику для локальной службы Azure в масштабе, см. Включение аналитики с помощью политик Azure.

Выполните следующие действия, чтобы включить аналитику из портал Azure:

  1. В портал Azure перейдите на страницу локальных ресурсов Azure, а затем выберите систему. На вкладке "Возможности" выберите "Аналитика".

    Снимок экрана: плитка Insights.

  2. На странице Аналитика выберите Начать работу.

    Снимок экрана: кнопка

  3. На странице конфигурации Аналитики выберите существующий DCR в раскрывающемся списке правила сбора данных. DCR указывает журналы событий и счетчики производительности, которые необходимо собирать и хранить в рабочей области Log Analytics. Insights создает DCR по умолчанию, если он еще не существует. Включены только DCR, настроенные для использования в Insights.

    Снимок экрана: окно конфигурации Insights.

  4. (Необязательно) Вы также можете создать новый DCR, нажав кнопку "Создать" на странице конфигурации Аналитики .

    Внимание

    Настоятельно рекомендуется не создавать собственный DCR. DCR, созданный с помощью Insights, включает специальный поток данных, необходимый для функционирования. Этот DCR можно изменить для сбора дополнительных данных, таких как события Windows и Syslog. Созданные через установку AMA DCR будут иметь префикс AzureStackHCI-, добавленный к имени DCR.

    1. На странице "Новое правило сбора данных" укажите имя подписки, имя DCR и конечную точку сбора данных (DCE). Точки сбора данных используются для доступа к службе конфигурации для получения связанных правил сбора данных для агента Azure Monitor. Дополнительные сведения о DCE см. в статье "Конечные точки сбора данных" в Azure Monitor.

      Примечание.

      Если вы используете закрытые ссылки на агенте, необходимо добавить DCE. Дополнительные сведения о параметрах сети AMA см. в разделе "Определение параметров сети агента Azure Monitor".

      Снимок экрана: окно правила сбора данных.

    2. Нажмите кнопку Просмотреть и создать.

      Если DCR еще не создан для немонитоизованного кластера, он создается с включенными счетчиками производительности и каналом журнала событий Windows.

  5. Просмотрите окончательный экран с сводкой по имени DCR, количеству журналов событий, счетчикам производительности и имени рабочей области Log Analytics, в которой хранятся данные. Выберите Настроить.

    Снимок экрана: раскрывающийся селектор правила сбора данных.

    После выбора настройки вы будете перенаправлены на страницу расширений, где можно просмотреть состояние установки агента. Настроив Insights, AMA автоматически устанавливается на всех узлах кластера.

  6. Перейдите на страницу локального ресурса Azure и выберите систему. Аналитика теперь отображается как настроенная на вкладке "Возможности" :

    Снимок экрана, показывающий плитку Insights в настроенном состоянии.

Правила сбора данных

При включении Аналитики на компьютере с агентом Azure Monitor необходимо указать DCR для использования. Дополнительные сведения о правилах сбора данных см. в разделе Правила сбора данных в Azure Monitor.

Параметр Description
Счетчики производительности Указывает, какие счетчики производительности данных следует собирать из операционной системы. Этот параметр необходим для всех компьютеров. Эти счетчики производительности используются для заполнения графических представлений в рабочей книге Insights. В настоящее время в книге Insights используются пять счетчиков производительности: Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/sec и RDMA Activity()\RDMA Outbound Bytes/sec.
Канал журнала событий Указывает, какие журналы событий Windows собираются из операционной системы. Этот параметр необходим для всех компьютеров. Журналы событий Windows используются для заполнения визуализаций в книге Insights. В настоящее время данные собираются с помощью двух каналов журнала событий Windows: - microsoft-windows-health/operationalmicrosoft-windows-sddc-management/operational
Рабочая область Log Analytics Рабочая область для хранения данных. Перечисляются только рабочие пространства с функцией "Insights".

Канал событий

Microsoft-windows-sddc-management/operational и Microsoft-windows-health/operational канал событий Windows добавляется в рабочую область Log Analytics в раздел журналы событий Windows.

Снимок экрана: окно добавления источника данных.

Собирая эти журналы, Insights показывает состояние работоспособности отдельных узлов, дисков, томов и виртуальных машин. По умолчанию добавляются пять счетчиков производительности.

Счетчики производительности

По умолчанию добавляются пять счетчиков производительности:

Снимок экрана: добавленные счетчики производительности.

В следующей таблице описываются отслеживаемые счетчики производительности:

Счетчики производительности Описание
Память(*)\Доступные байты Доступные байты — это объем физической памяти в байтах, который сразу же доступен для выделения в процессе или для использования системой.
Сетевой интерфейс(*)\Всего байт/с Скорость передачи и приёма байтов через каждый сетевой адаптер, включая символы кадрирования. Всего байтов в секунду — это сумма байтов, полученных в секунду, и байтов, отправленных в секунду.
Процессор(_Всего)% Время работы процессора Процент истекшего времени, когда все потоки обработки использовали обработчик для выполнения инструкций.
RDMA Активность(*)\RDMA входящие байты/сек Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду.
Действие RDMA(*)\RDMA исходящие байты в секунду Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду.

После включения Аналитики может потребоваться до 15 минут для сбора данных. После завершения процесса вы сможете увидеть многофункциональную визуализацию работоспособности кластера из меню "Аналитика " на левой панели:

Снимок экрана, отображающий визуализации Insight.

Отключение аналитики

Чтобы отключить Аналитику, выполните следующие действия.

  1. Выберите "Аналитика" на вкладке "Возможности ".

  2. Выберите "Отключить аналитику".

    Снимок экрана: окно

При отключении функции Insights связь между правилом сбора данных и кластером удаляется, а журналы управления SDDC и служба здоровья больше не собираются. Однако имеющиеся данные не удаляются. Если вы хотите удалить эти данные, перейдите в рабочую область DCR и Log Analytics и удалите эти данные вручную.

Обновить Аналитику

На плитке Insights отображается Требуется обновление сообщение в следующих случаях:

  • Правило сбора данных изменено.
  • Событие из журнала событий Windows, связанное с работоспособностью, удалено.
  • Удаляется любой из пяти счетчиков производительности из рабочей области Log Analytics .

Чтобы включить аналитику снова, выполните следующие действия.

  1. Выберите плитку Insights в разделе "Возможности".

  2. Нажмите кнопку "Обновить", чтобы просмотреть визуализации снова.

    Снимок экрана: окно Update Insights.

Устранение неполадок

В этом разделе приводятся рекомендации по устранению проблем с использованием Аналитики для локальной среды Azure.

Устранение неполадок с пустой страницей книги Excel, на которой не отображаются данные

Проблема. Вы видите пустую Workbooks страницу без данных, как показано на следующем снимке экрана.

Снимок экрана пустой страницы в Workbooks.

Возможные причины. Эта проблема может быть вызвана несколькими факторами, такими как недавнее изменение конфигурации системы Аналитики или неправильная настройка связанного DCR.

Решение. Чтобы устранить проблему, выполните следующие действия в последовательности:

  1. Если вы недавно настроили Insights, подождите до одного часа, пока AMA будет собирать данные.
  2. Проверьте конфигурацию связанного DCR. Убедитесь, что каналы событий и счетчики производительности добавляются в качестве источников данных в связанный DCR, как описано в разделе "Правила сбора данных".
  3. Если проблема сохраняется после выполнения описанных выше действий, и вы по-прежнему не видите никаких данных, обратитесь в службу поддержки клиентов за помощью.

Дополнительные сведения об устранении неполадок см. в руководстве по устранению неполадок для агента Azure Monitor.

Визуализации инсайтов

После включения Аналитики в следующих таблицах содержатся сведения обо всех ресурсах.

Здоровье

Предоставляет ошибки работоспособности в кластере.

Вы можете просматривать проблемы со работоспособностью, такие как неподдерживаемое оборудование, неподдерживаемый диск, неправильные записи блоков, отсоединенные диски, потребности восстановления, превышение ресурсов ЦП, памяти и использования хранилища, а также высокая задержка. Для получения полного списка поддерживаемых сбоев службы здоровья, см. в разделе Просмотр сбоев службы здоровья.

Метрика Описание Ед. изм. Пример
Неисправность Краткое описание сбоев работоспособности. Щелкнув ссылку, откроется боковая панель с дополнительными сведениями. Нет единицы ПорогВместимостиБассейнаПревышен
Тип ресурса сбоя Тип ресурса, который столкнулся с ошибкой. Нет единицы StoragePool
Идентификатор сбойного ресурса Уникальный идентификатор ресурса, который столкнулся с сбоем. Уникальный идентификатор {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2}
Серьезность Серьезность сбоя может быть предупредительной или критической. Нет единицы Предупреждение
Начальное время сбоя Метка времени последнего обновления узла. Дата и время 4.9.2022, 12:15:42

Узлы

Предоставляет сведения о работоспособности и производительности серверов.

Метрика Описание Ед. изм. Пример
Узлы Имена узлов в кластере. Нет единицы VM-1
Последнее обновление Дата и время последнего обновления узла. Дата и время 04.09.2022, 12:15:42 после полудня
Состояние Состояние работоспособности узлов в кластере. Это может быть здорово, предупреждение, критическое и другое Здоровый
Использование процессора Процент времени, когда процесс использовал ЦП. Процент 56 %
Использование памяти Использование памяти узлового процесса равно счетчику Process\Private Bytes плюс размер сопоставленных с памятью данных. Процент 16 %
Логические процессоры Количество логических процессоров. Подсчет 2
ЦП Количество ЦП. Счёт 2
Время безотказной работы Время, в течение которого машина, особенно компьютер, работает. Временной диапазон 2.609 ч.
Сайт Имя сайта, к которому принадлежит узел. Имя сайта SiteA
Доменное имя Локальный домен, к которому принадлежит узел. Нет единицы Contoso.local

Виртуальные машины

Предоставляет состояние виртуальных машин на каждом узле в кластере. Виртуальная машина может находиться в одном из следующих состояний: выполнение, остановка, сбой или другое (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка).

Метрика Описание Ед. изм. Пример
Узлы Имя узла. Нет единицы Sample-VM-1
Последнее обновление Это дает дату и время последнего обновления узла Дата и время 4.9.2022, 12:24:02 после полудня
Общее число виртуальных машин Количество виртуальных машин в узле. Количество 0 из 0 запущено
Бег Количество виртуальных машин, работающих в узле. Количество / Граф 2
Остановлено Количество виртуальных машин, остановленных на узле. Счёт 3
Неудачно Количество виртуальных машин, вышедших из строя на узле. Счет 2
Другие Если виртуальная машина находится в одном из следующих состояний (неизвестное, запуск, создание моментального снимка, сохранение, остановка, приостановка, возобновление, приостановленная, приостановленная), оно считается как "Другое." Счёт 2

Хранилище

В следующей таблице приведены сведения о работоспособности томов и дисков в кластере:

Метрика Описание Единица Пример
Объемы Имя тома Нет единицы История Производительности Кластера
Последнее обновление Дата и время последнего обновления хранилища. Дата и время 14.04.2022, 14:58:55
Состояние Состояние тома. Здоровый, предупреждение, аварийное и другое. Здоровый
Общая емкость Общая емкость устройства в байтах за отчетный период. Байт 2.5 ГБ
Доступная емкость Доступная емкость в байтах в отчетный период. Байт 20 Б
Iops Количество операций ввода-вывода в секунду. посекундно. 45/с
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений Байты в секунду 5B/с
Задержка Время выполнения запроса ввода-вывода. Второй 0.0016 s
Устойчивость Способность восстанавливаться после сбоев. Обеспечивает максимальную доступность данных. Нет единицы Трехстороннее зеркало
Дедупликация Процесс уменьшения физического числа байтов данных, которые должны храниться на диске. Доступно или нет Да/нет
Файловая система Тип файловой системы. Нет единицы ReFS

Цены на Azure Monitor

При включении визуализации мониторинга журналы собираются из:

  • Управление работоспособностью (Microsoft-windows-health/operational).
  • Управление SDDC (Microsoft-Windows-SDDC-Management/Operational; Идентификатор события: 3000, 3001, 3002, 3003, 3004).

Плата взимается на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Azure Monitor предоставляет тарифы с оплатой по факту использования, и первые 5 ГБ в месяц на учетную запись начисления предоставляются бесплатно. Так как цены могут отличаться из-за нескольких факторов, таких как регион Azure, который вы используете, посетите калькулятор цен Azure Monitor для наиболее актуальных вычислений цен.

Следующие шаги