Мониторинг нескольких локальных систем Azure версии 23H2 с помощью Insights

Статья
11/23/2024

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье объясняется, как использовать Аналитику для мониторинга нескольких локальных систем Azure. Сведения об одной локальной системе Azure см. в статье "Мониторинг единой локальной системы Azure" с помощью Insights.

Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждой локальной системы Azure см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".

Чтобы отслеживать несколько локальных систем Azure с помощью Insights, необходимо включить Аналитику для каждой системы по отдельности. Вместо этого вы можете включить аналитику в масштабе с помощью политик Azure. Дополнительные сведения см. в статье Enable Insights for Azure Local at scale using Azure policies.

Просмотрите видео с кратким введением:

Просмотр сведений о работоспособности, производительности и использовании

Аналитика хранит свои данные в рабочей области Log Analytics, что позволяет обеспечить эффективную агрегирование и фильтрацию и анализ тенденций данных с течением времени. Для Аналитики нет прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Вы можете получить доступ к Аналитике из Azure Monitor>>Local. Используйте следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, узлов, виртуальных машин и хранилища.

Фильтрация результатов

Визуализация может быть отфильтровано по подпискам. Результаты можно отфильтровать на основе следующих раскрывающихся меню:

Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
Подписки. Показывает подписки, зарегистрированные в локальных кластерах Azure. В этом фильтре можно выбрать несколько подписок.
Кластеры: перечисляет зарегистрированные локальные кластеры Azure, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.

Добавление в мониторинг

Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите > возможностей". Если кластер не отображается, убедитесь, что он недавно подключен к Azure.

Столбец	Description	Пример
Кластер	Имя кластера.	27cls1
Состояние подключения Azure	Состояние локального ресурса Azure.	Connected
Версия ОС	Операционная система строится на узле.	10.0.20348.10131

По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:

Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:

Excel предоставит следующее состояние подключения Azure:

0. Не зарегистрировано
1. Отключено
2. Не недавно
3. Подключено

Работоспособность кластера

Это представление содержит обзор работоспособности кластеров.

Столбец	Description	Пример
Кластер	Имя кластера.	27cls1
Последнее обновление	Метка времени последнего обновления узла.	4.9.2022, 12:15:42
Состояние	Предоставляет состояние работоспособности узлов в кластере. Это может быть здорово, предупреждение, критическое или другое.	Работоспособно
Ресурс сбоя	Описание того, какой ресурс вызвал ошибку.	Сервер, StoragePool, подсистема
Всего узлов	Количество узлов в кластере.	4

Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Кроме того, убедитесь, что кластеры недавно подключены к Azure и убедитесь, что кластеры не отфильтрованы в этой книге.

Узлы

В этом представлении представлен обзор работоспособности узла и производительности и использования выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с кластером и ресурсом узла, чтобы перейти на соответствующую страницу ресурсов.

Виртуальные машины

Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена для просмотра распределения виртуальных машин между узлами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.

Метрическая	Description	Пример
Узел кластера >	Имя кластера. При расширении отображаются узлы в кластере.	Sample-VM-1
Последнее обновление	Метка даты и времени последнего обновления узла.	4.9.2022, 12:24:02
Общее число виртуальных машин	Количество виртуальных машин в узле в кластере.	1 из 2 запущенных
Выполняется	Количество виртуальных машин, работающих в узле в кластере.	2
Остановлено	Количество виртуальных машин, остановленных в узле в кластере.	3
Неудачно	Количество виртуальных машин не удалось выполнить в узле в кластере.	2
Другие	Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка), она считается другой.	2

Хранилище

В этом представлении показана работоспособность томов, использования и производительности в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Плитки в верхней части содержат обзор работоспособности хранилища.

Метрическая	Description	Пример
Том кластера >	Имя кластера. При расширении отображаются тома в кластере.	AltaylCluster1 > ClusterPerformanceHistory
Последнее обновление	Метка даты и времени последнего обновления хранилища.	4.14.2022, 2:58:55
Работоспособности тома	Состояние тома. Это может быть здорово, предупреждение, критическое или другое.	Работоспособно
Размер	Общая емкость устройства в байтах за отчетный период.	25 млрд
Использование	Процент доступной емкости в течение отчетного периода.	23.54%
Iops	Количество операций ввода-вывода в секунду.	45/с
Тенденция	Тенденция операций ввода-вывода в секунду.
Пропускная способность	Количество байтов в секунду, обрабатываемых Шлюзом приложений	5B/с
Тренд (B/s)	Тенденция пропускной способности.
Среднее время задержки	Задержка — это среднее время, необходимое для завершения запроса ввода-вывода.	334 мкс

Настройка аналитики

Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.

Если вы используете визуализацию из центра > Azure Monitor > Insights Local, выберите "Изменить >> сохранить как", чтобы сохранить копию измененной версии в настраиваемую книгу.

Книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой книге.

Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:

Поддержка

Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для локальной службы Azure в разделе "Мониторинг и управление".

Канал журнала событий

Аналитические представления и представления мониторинга основаны на канале журнала событий Windows-SDDC-Management или Operations Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.

Просмотр и изменение интервала кэша дампа

Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).

Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Используйте следующие командлеты, чтобы изменить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

События Windows в канале журнала

Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.

Идентификатор события	Тип события
3000	Сервер
3001	Диск
3002	Громкость
3003	Виртуальная машина
3004	Кластер

Значение столбца RenderedDescription на сервере 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Большинство переменных являются самообязательными из этих сведений JSON. Однако в следующей таблице перечислены несколько переменных, которые немного сложнее понять.

«Переменная»	Description
m_servers	Массив узлов.
m_statusCategory	Состояние работоспособности узла.
m_status	Состояние узла. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение	Значение
0	Работоспособно
1	Предупреждение
2	Unhealthy
255	Другие

Значения для переменной m_status приведены следующим образом:

Значение	Значение
0	Up
1	Down
2	В обслуживании
3	Присоединение
4	Обычная
5	Изоляция
6	Помещено в карантин
7	Осушение
8	Очистка завершена
9	Сбой очистки
0xffff	Неизвестно

Значение столбца RenderedDescription события диска 3001

Событие диска 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Значение столбца RenderedDescription события тома 3002

Событие тома 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Большинство переменных являются самообязательными из приведенных выше сведений JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

«Переменная»	Description
VolumeList	Массив томов.
m_StatusCategory	Состояние работоспособности тома.
m_Status	Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение	Значение
0	Работоспособно
1	Предупреждение
2	Unhealthy
255	Другие

Значения для переменной m_status приведены следующим образом:

Значение	Значение
0	Неизвестно
1	Другие
2	ОК
3	Требуется восстановление
4	Ударный
5	Прогнозируемый сбой
6	Ошибка
7	Неустранимая ошибка
8	Запуск
9	Остановка
10	Остановлено
11	Обслуживается
12	Нет контакта
13	Связь потеряна
14	Прервано
15	Бездействует
16	Поддержка сущности в ошибке
17	Завершено
18	Режим питания
19	Перемещение
0xD002	Down
0xD003	Требуется повторная синхронизация

Значение столбца RenderedDescription события виртуальной машины 3003

Событие виртуальной машины 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Значение столбца RenderedDescription для события кластера 3004

Событие кластера 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Дополнительные сведения о собранных данных см. в служба работоспособности сбоях.

Следующие шаги

Связанные сведения:

Мониторинг одной локальной системы Azure с помощью Insights

Поделиться через