Поделиться через


Мониторинг нескольких кластеров Azure Stack HCI с помощью Insights

Область применения: Azure Stack HCI версии 22H2

Внимание

Azure Stack HCI теперь является частью Azure Local. Однако старые версии Azure Stack HCI, например 22H2, будут продолжать ссылаться на Azure Stack HCI и не отражают изменение имени. Подробнее.

В этой статье объясняется, как использовать Аналитику для мониторинга нескольких кластеров Azure Stack HCI. Сведения о одном кластере Azure Stack HCI см. в статье "Мониторинг Azure Stack HCI" с помощью Insights.

Внимание

Если вы зарегистрировали кластер Azure Stack HCI и настроили Insights до ноября 2023 года, некоторые функции, использующие агент Azure Monitor (AMA), такие как Arc for Servers, VM Insights, Defender для облака или Sentinel, могут неправильно собирать журналы и данные событий. Рекомендации по устранению неполадок см. в разделе "Устранение неполадок кластеров", зарегистрированных до ноября 2023 г.

Сведения о преимуществах, предварительных требованиях и способах включения аналитики для каждого кластера см. в разделе "Преимущества", "Предварительные требования" и "Включить аналитику".

Просмотрите видео с кратким введением:

Просмотр сведений о работоспособности, производительности и использовании

Система 'Инсайтс' хранит свои данные в рабочей области Log Analytics, что позволяет ей обеспечивать мощное агрегирование и фильтрацию, а также анализировать тенденции данных с течением времени. Для Инсайтов нет никаких прямых затрат. Пользователям выставляются счета на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.

Вы можете получить доступ к Аналитике из Центра сведений > Azure Monitor > на Azure Stack HCI. Вы увидите следующие вкладки для переключения между представлениями: добавление в мониторинг, работоспособности кластера, серверов, виртуальных машин, хранилища.

Фильтрация результатов

Визуализация может быть отфильтрована среди подписок. Результаты можно отфильтровать на основе следующих раскрывающихся меню:

  • Диапазон времени: этот фильтр позволяет выбрать диапазон для представления тренда. Значение по умолчанию — Последние 24 часа.
  • Подписки. Показывает подписки, которые зарегистрировали кластеры Azure Stack HCI. В этом фильтре можно выбрать несколько подписок.
  • Кластеры HCI: перечисляет зарегистрированные кластеры Azure Stack HCI, имеющие возможности журналов и мониторинга, включенные в выбранном диапазоне времени. В этом фильтре можно выбрать несколько кластеров.
  • Группы ресурсов. Этот фильтр позволяет выбрать все кластеры в группе ресурсов.

Добавление в мониторинг

Эта функция содержит сведения о кластерах, которые не отслеживаются пользователем. Чтобы начать мониторинг кластера, выберите его, чтобы открыть этот кластер, а затем выберите Аналитика возможностей. Если кластер не отображается, убедитесь, что он недавно подключен к Azure.

Снимок экрана: выбор кластера для мониторинга.

Столбец Описание Пример
Кластер Имя кластера. 27cls1
Состояние подключения Azure Состояние ресурса HCI. Подключено
Версия ОС Операционная система строится на сервере. 10.0.20348.10131

По умолчанию в представлении сетки отображаются первые 250 строк. Можно задать значение, изменив строки сетки, как показано на следующем рисунке:

Снимок экрана: экран для задания значений сетки.

Сведения в Excel можно экспортировать, выбрав "Экспорт в Excel ", как показано на следующем рисунке:

Снимок экрана: ссылка для экспорта в Excel.

Excel предоставит следующее состояние подключения Azure:

  • 0. Не зарегистрировано
  • 1. Отключено
  • 2. Не недавно
  • 3. Подключено

Работоспособность кластера

Это представление содержит обзор работоспособности кластеров.

Снимок экрана: общие сведения о работоспособности кластера.

Столбец Описание Пример
Кластер Имя кластера. 27cls1
Последнее обновление Метка времени последнего обновления сервера. 4.9.2022, 12:15:42
Состояние Обеспечивает работоспособность ресурсов сервера в кластере. Это может быть здорово, предупреждение, критическое или другое. Здоровый
Сбойный ресурс Описание того, какой ресурс вызвал ошибку. Сервер, StoragePool, подсистема
Всего серверов Количество серверов в кластере. 4

Если кластер отсутствует или отображает состояние "Другой", перейдите в рабочую область Log Analytics, используемую для кластера, и убедитесь, что конфигурация агента записывает данные из журнала работоспособности или эксплуатации Microsoft-Windows. Кроме того, проверьте, что кластеры недавно подключались к Azure, и убедитесь, что кластеры не отфильтрованы в этом документе.

Сервер

Это представление содержит общие сведения о работоспособности сервера и производительности и использовании выбранных кластеров. Это представление создается с помощью идентификатора события сервера 3000 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена, чтобы увидеть состояние работоспособности узла. Вы можете взаимодействовать с ресурсом кластера и сервера, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: работоспособность серверов.

Виртуальные машины

Это представление предоставляет состояние всех виртуальных машин в выбранном кластере. Представление создается с помощью идентификатора события виртуальной машины 3003 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Каждая строка может быть расширена для просмотра распределения виртуальных машин между серверами в кластере. Вы можете взаимодействовать с ресурсом кластера и узла, чтобы перейти на соответствующую страницу ресурсов.

Снимок экрана: работоспособность виртуальных машин.

Метрика Описание Пример
Сервер кластера > Имя кластера. При расширении отображаются серверы в кластере. Sample-VM-1
Последнее обновление Метка даты и времени последнего обновления сервера. 04.09.2022, 12:24:02
Общее число виртуальных машин Количество виртуальных машин в узле сервера в кластере. 1 из 2 запущенных
Бег Количество виртуальных машин, работающих на узле сервера в кластере. 2
Остановлено Количество виртуальных машин, остановленных на узле сервера в кластере. 3
Неудачно Количество виртуальных машин, вышедших из строя на узле сервера кластера. 2
Другие Если виртуальная машина находится в одном из следующих состояний (Неизвестно, Запуск, Сделан снимок, Сохранение, Остановка, Приостановлено, Возобновление, Приостановлено, Выключено), она считается "Другой". 2

Хранилище

В этом представлении показано состояние томов, использование и производительность в отслеживаемых кластерах. Разверните кластер, чтобы просмотреть состояние отдельных томов. Это представление создается с помощью идентификатора события тома 3002 канала журнала событий Microsoft-Windows-SDDC-Management/Operations Windows. Плитки в верхней части содержат обзор состояния систем хранения.

Снимок экрана: состояние томов хранилища.

Метрика Описание Пример
Том кластера > Имя кластера. При расширении отображаются тома в кластере. AltaylCluster1 > ClusterPerformanceHistory
Последнее обновление Метка даты и времени последнего обновления хранилища. 14.04.2022, 14:58:55
Состояние тома Состояние тома. Это может быть состояние здоровья, предупреждение, критическое состояние или другое. Здоровый
Размер Общая емкость устройства в байтах за отчетный период. 25 млрд
Использование Процент доступной емкости в течение отчетного периода. 23.54%
Иопс Количество операций ввода-вывода в секунду. 45/с
Тенденция Тенденция IOPS.
Пропускная способность Количество байтов в секунду, обрабатываемых Шлюзом приложений 5B/с
Тренд (байт/с) Тенденция пропускной способности.
Среднее время задержки Задержка — это среднее время, необходимое для завершения запроса ввода-вывода. 334 мкс

Настройка инсайтов

Так как пользовательский интерфейс основан на шаблонах книг Azure Monitor, пользователи могут изменять визуализации и запросы и сохранять их в виде настраиваемой книги.

Если вы используете визуализацию из >, выберите >", чтобы сохранить копию измененной версии в настраиваемую книгу.

Книги сохраняются в группе ресурсов. Все пользователи, имеющие доступ к группе ресурсов, могут получить доступ к настраиваемой рабочей книге.

Большинство запросов записываются с помощью язык запросов Kusto (KQL). Некоторые запросы записываются с помощью запроса Resource Graph. Дополнительные сведения см. в следующих статьях:

Поддержка

Чтобы открыть запрос в службу поддержки для Insights, используйте службу Insights для Azure Stack HCI в разделе "Мониторинг и управление".

Канал журнала событий

Аналитические представления и представления мониторинга основаны на канале журнала событий Microsoft-Windows-SDDC-Management/Operational Windows. Если мониторинг включен, данные из этого канала сохраняются в рабочей области Log Analytics.

Просмотр и изменение интервала кэша дампа

Интервал по умолчанию для дампа кэша имеет значение 3600 секунд (1 час).

Используйте следующие командлеты PowerShell для просмотра значения интервала дампа кэша:

Get-ClusterResource "sddc management" | Get-ClusterParameter

Используйте следующие командлеты, чтобы изменить частоту дампа кэша. Если задано значение 0, он остановит публикацию событий:

Get-ClusterResource "sddc management" | Set-ClusterParameter -Name CacheDumpIntervalInSeconds -Value <value in seconds>

События Windows в канале журнала

Этот канал включает пять событий. Каждое событие имеет имя кластера и идентификатор Azure Resource Manager в качестве EventData.

Идентификатор события Тип события
3000 Сервер
3001 Диск
3002 Громкость
3003 Виртуальная машина
3004 Кластер

Значение столбца RenderedDescription события сервера 3000

{
   "m_servers":[
      {
         "m_statusCategory":"Integer",
         "m_status":[
            "Integer",
            "…"
         ],
         "m_id":"String",
         "m_name":"String",
         "m_totalPhysicalMemoryInBytes":"Integer",
         "m_usedPhysicalMemoryInBytes":"Integer",
         "m_totalProcessorsUsedPercentage":"Integer",
         "m_totalClockSpeedInMHz":"Integer",
         "m_uptimeInSeconds":"Integer",
         "m_InboundNetworkUsage":"Double (Bits/sec)",
         "m_OutboundNetworkUsage":"Double (Bits/sec)",
         "m_InboundRdmaUsage":"Double (Bits/sec)",
         "m_OutboundRdmaUsage":"Double (Bits/sec)",
         "m_site":"String",
         "m_location":"String",
         "m_vm":{
            "m_totalVmsUnknown":"Integer",
            "m_totalVmsRunning":"Integer",
            "m_totalVmsStopped":"Integer",
            "m_totalVmsFailed":"Integer",
            "m_totalVmsPaused":"Integer",
            "m_totalVmsSuspended":"Integer",
            "m_totalVmsStarting":"Integer",
            "m_totalVmsSnapshotting":"Integer",
            "m_totalVmsSaving":"Integer",
            "m_totalVmsStopping":"Integer",
            "m_totalVmsPausing":"Integer",
            "m_totalVmsResuming":"Integer"
         },
         "m_osVersion":"String",
         "m_buildNumber":"String",
         "m_totalPhysicalProcessors":"Integer",
         "m_totalLogicalProcessors":"Integer"
      },
      "…"
   ],
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются понятными без объяснений в этой информации JSON. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

Переменная Описание
m_servers Массив узлов сервера.
m_statusCategory Состояние работоспособности сервера.
m_status Состояние сервера. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Здоровый
1 Предупреждение
2 Нездоровый
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Вверх
1 вниз
2 На техобслуживании
3 Присоединение
4 Обычная
5 Изолированный
6 Помещено в карантин
7 Осушение
8 Очистка завершена
9 Сбой очистки
0xffff Неизвестно

Значение столбца "RenderedDescription" для события диска 3001

Событие диска 3001

{
    "m_drives":[
        {
            "m_uniqueId":"String",
            "m_model":"String",
            "m_type":"Integer",
            "m_canPool":"Boolean",
            "m_sizeInBytes":"Integer",
            "m_sizeUsedInBytes":"Integer",
            "m_alerts":{
                "m_totalUnknown":"Integer",
                "m_totalHealthy":"Integer",
                "m_totalWarning":"Integer",
                "m_totalCritical":"Integer"
            }
        },
        "…"
    ],
    "m_correlationId":"String",
    "m_isLastElement":"Boolean"
}

Значение столбца RenderedDescription события тома 3002

Событие тома 3002

{
   "VolumeList":[
      {
         "m_Id":"String",
         "m_Label":"String",
         "m_Path":"String",
         "m_StatusCategory":"Integer",
         "m_Status":[
            "Integer",
            "…"
         ],
         "m_Size":"Integer (Bytes)",
         "m_SizeUsed":"Integer (Bytes)",
         "m_TotalIops":"Double (Count/second)",
         "m_TotalThroughput":"Double (Bytes/Second)",
         "m_AverageLatency":"Double (Seconds)",
         "m_Resiliency":"Integer",
         "m_IsDedupEnabled":"Boolean",
         "m_FileSystem":"String"
      },
      "…"
   ],
   "m_Alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
} 

Большинство переменных являются самоочевидными из приведенной выше JSON-информации. Однако в таблице ниже перечислены несколько переменных, которые немного сложнее понять.

«Переменная» Описание
Список томов Массив томов.
КатегорияСтатуса Состояние тома.
м_Статус Состояние тома. Это массив, который может содержать одно или два значения. Первое значение является обязательным (0–4). Второе значение является необязательным (5-9).

Значения переменной m_statusCategory приведены следующим образом:

Значение Значение
0 Здоровый
1 Предупреждение
2 Нездоровый
255 Другие

Значения для переменной m_status приведены следующим образом:

Значение Значение
0 Неизвестно
1 Другие
2 ОК
3 Требуется восстановление
4 Под стрессом
5 Прогнозируемый сбой
6 Ошибка
7 Неустранимая ошибка
8 Запуск
9 Остановка
10 Остановлено
11 В эксплуатации
12 Нет контакта
13 Связь потеряна
14 Прервано
15 Неактивный
16 Поддержка сущности при ошибке
17 Завершено
18 Режим питания
19 Перемещение
0xD002 Вниз
0xD003 Требуется повторная синхронизация

Значение столбца RenderedDescription события виртуальной машины 3003

Событие виртуальной машины 3003

{
   "m_totalVmsUnknown":"Integer",
   "m_totalVmsRunning":"Integer",
   "m_totalVmsStopped":"Integer",
   "m_totalVmsFailed":"Integer",
   "m_totalVmsPaused":"Integer",
   "m_totalVmsSuspended":"Integer",
   "m_totalVmsStarting":"Integer",
   "m_totalVmsSnapshotting":"Integer",
   "m_totalVmsSaving":"Integer",
   "m_totalVmsStopping":"Integer",
   "m_totalVmsPausing":"Integer",
   "m_totalVmsResuming":"Integer",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }
}

Значение столбца RenderedDescription для события кластера 3004

Событие кластера 3004

{
   "m_cpuUsage":"Double (%)",
   "m_totalVolumeIops":"Double",
   "m_averageVolumeLatency":"Double (Seconds)",
   "m_totalVolumeThroughput":"Double (Bytes/Second)",
   "m_totalVolumeSizeInBytes":"Integer",
   "m_usedVolumeSizeInBytes":"Integer",
   "m_totalMemoryInBytes":"Integer",
   "m_usedMemoryInBytes":"Integer",
   "m_isStretch":"Boolean",
   "m_QuorumType":"String",
   "m_QuorumMode":"String",
   "m_QuorumState":"String",
   "m_alerts":{
      "m_totalUnknown":"Integer",
      "m_totalHealthy":"Integer",
      "m_totalWarning":"Integer",
      "m_totalCritical":"Integer"
   }

Дополнительные сведения о собранных данных см. в неисправностях службы здоровья.

Следующие шаги

Связанные сведения: