Мониторинг одного кластера Azure Stack HCI с помощью Insights
Область применения: Azure Stack HCI версии 22H2
Внимание
Azure Stack HCI теперь является частью Azure Local. Однако старые версии Azure Stack HCI, например 22H2, будут продолжать ссылаться на Azure Stack HCI и не отражают изменение имени. Подробнее.
В этой статье объясняется, как использовать Аналитику для мониторинга одного кластера Azure Stack HCI. Сведения о нескольких кластерах Azure Stack HCI см. в статье "Мониторинг нескольких кластеров Azure Stack HCI" с помощью Insights.
Аналитика — это функция Azure Monitor, которая быстро запускает мониторинг кластера Azure Stack HCI. Вы можете просматривать ключевые метрики, информацию о состоянии и использовании, касающиеся кластера, серверов, виртуальных машин и хранилища.
Внимание
Если вы зарегистрировали кластер Azure Stack HCI и настроили Insights до ноября 2023 года, некоторые функции, использующие агент Azure Monitor (AMA), такие как Arc for Servers, VM Insights, Defender для облака или Sentinel, могут неправильно собирать журналы и данные событий. Рекомендации по устранению неполадок см. в разделе "Устранение неполадок кластеров", зарегистрированных до ноября 2023 г.
Льготы
Аналитика для Azure Stack HCI предлагает следующие преимущества:
Управляется Azure. Служба Insights управляется в Azure и доступна через портал Azure, что гарантирует её постоянную актуальность. Нет необходимости в настройке базы данных или специального программного обеспечения.
Масштабируемость. Insights способен загружать более 400 информационных наборов кластеров в нескольких подписках одновременно. Нет ограничений на кластер, домен или физическое расположение.
Возможность настройки. Опыт Insights построен на шаблонах рабочих книг Azure Monitor. Это позволяет изменять представления и запросы, изменять или задавать пороговые значения, которые соответствуют определенным ограничениям, а затем сохранять эти настройки в книге. Затем вы можете закрепить диаграммы в рабочих книгах на информационных панелях Azure.
Настройка Аналитики для Azure Stack HCI
Предварительные требования и параметры для использования Аналитики зависят от используемой версии Azure Stack HCI. Выберите одну из следующих вкладок, чтобы узнать, как использовать Аналитику для конкретной версии Azure Stack HCI.
Функция Аналитики в Azure Stack HCI версии 22H2 и более поздних версиях использует AMA, которая предлагает значительные преимущества по сравнению с устаревшим агентом Microsoft Monitoring Agent (MMA), используемым в Azure Stack HCI версии 21H2 и более ранними версиями. К этим преимуществам относятся улучшенная скорость, улучшенная безопасность и улучшенная производительность. Вы можете подключить новые узлы к AMA или перенести существующие узлы из устаревшего агента в AMA.
Рекомендуется обновить систему Azure Stack HCI до версии 22H2 или более поздней, чтобы воспользоваться преимуществами возможностей аналитики с AMA.
Начиная с накопительного обновления за май 2023 г. для Azure Stack HCI версии 22H2 можно отслеживать локальные системы Azure Stack HCI с помощью Insights для Azure Stack HCI.
Предварительные условия
Ниже приведены предварительные требования для использования Insights для Azure Stack HCI:
Кластер Azure Stack HCI должен быть зарегистрирован в Azure и с поддержкой Arc. Если вы зарегистрировали кластер 15 июня 2021 года или после этой даты, это происходит по умолчанию. В противном случае необходимо включить интеграцию Azure Arc.
Кластер должен иметь Azure Stack HCI версии 22H2 и накопительное обновление за май 2023 года или более позднее.
Управляемое удостоверение для ресурса Azure должно быть включено. Дополнительные сведения см. в статье "Включено расширенное управление".
Включение аналитики
Функция Insights помогает отслеживать все кластеры Azure Stack HCI, связанные с рабочей областью Log Analytics, предоставляя полезные параметры состояния. Аналитика устанавливает агент Azure Monitor и помогает настроить правила сбора данных (DCR) для мониторинга кластера Azure Stack HCI.
Чтобы включить эту возможность из портал Azure, выполните следующие действия.
В портал Azure перейдите на страницу ресурсов кластера Azure Stack HCI, а затем выберите кластер. На вкладке "Возможности" выберите "Аналитика".
На странице "Аналитика" выберите "Начало работы".
Примечание.
Кнопка "Начало работы" доступна только для Azure Stack HCI версии 22H2 с накопительным обновлением или более поздним обновлением за май 2023 г. и только после включения управляемого удостоверения. В противном случае эта кнопка отключена.
На странице конфигурации системы анализа данных выберите существующий DCR в раскрывающемся списке правила сбора данных. DCR указывает журналы событий и счетчики производительности, которые необходимо собирать и хранить в рабочей области Log Analytics. Инсайты создают DCR по умолчанию, если он еще не существует. Включены только DCR, активированные для аналитики данных.
(Необязательно) Вы также можете создать новый DCR, выбрав Создать новый на странице конфигурации Инсайтов.
Внимание
Настоятельно рекомендуется не создавать собственный DCR. DCR, созданный Insights, включает специальный поток данных, необходимый для его работы. Этот DCR можно изменить для сбора дополнительных данных, таких как события Windows и Syslog. Созданные через установку AMA DCR будут иметь префикс
AzureStackHCI-
, добавленный к имени DCR.На странице "Новое правило сбора данных" укажите имя подписки, имя DCR и конечную точку сбора данных (DCE). Конечные точки сбора данных используются для доступа к службе конфигурации с целью получения связанных правил сбора данных для агента Azure Monitor. Дополнительные сведения о DCE см. в статье "Конечные точки сбора данных" в Azure Monitor.
Примечание.
Если вы используете приватные ссылки на агенте, необходимо добавить DCE. Дополнительные сведения о параметрах сети AMA см. в разделе "Определение параметров сети агента Azure Monitor".
Нажмите кнопку Просмотреть и создать.
Если DCR еще не создан для немонитоизованного кластера, он создается с включенными счетчиками производительности и каналом журнала событий Windows.
Просмотрите окончательный экран с сводкой по имени DCR, количеству журналов событий, счетчикам производительности и имени рабочей области Log Analytics, в которой хранятся данные. Выберите Настроить.
После выбора настройки вы будете перенаправлены на страницу расширений, где можно просмотреть состояние установки агента. Настроив Insights, AMA автоматически устанавливается на всех узлах кластера.
Перейдите на страницу ресурсов кластера Azure Stack HCI и выберите кластер. Аналитика теперь отображается как настроенная на вкладке "Возможности" :
Правила сбора данных
При включении Аналитики на компьютере с агентом Azure Monitor необходимо указать DCR для использования. Чтобы узнать больше о правилах сбора данных, см. раздел "Правила сбора данных" в Azure Monitor.
Параметр | Description |
---|---|
Счетчики производительности | Указывает, какие счетчики производительности данных нужно собирать из операционной системы. Этот параметр необходим для всех компьютеров. Эти счетчики производительности используются для заполнения визуализаций в рабочей тетради Insights. В настоящее время в книге Insights используются пять счетчиков производительности: Memory()\Available Bytes , Network Interface()\Bytes Total/sec , Processor(_Total)\% Processor Time , RDMA Activity()\RDMA Inbound Bytes/sec и RDMA Activity()\RDMA Outbound Bytes/sec |
Канал журнала событий | Указывает, какие журналы событий Windows собираются из операционной системы. Этот параметр необходим для всех компьютеров. Журналы событий Windows используются для заполнения визуализаций в книге Insights. В настоящее время данные собираются с помощью двух каналов журнала событий Windows: - microsoft-windows-health/operational microsoft-windows-sddc-management/operational |
Рабочая область Log Analytics | Рабочая область для хранения данных. Перечислены только рабочие области с функцией аналитики. |
Канал событий
Канал событий Windows Microsoft-windows-sddc-management/operational
и Microsoft-windows-health/operational
добавляется в рабочую область Log Analytics в разделе журналы событий Windows.
Собирая эти журналы, Insights показывает состояние отдельных серверов, дисков, томов и виртуальных машин. По умолчанию добавляются пять счетчиков производительности.
Счетчики производительности
По умолчанию добавляются пять счетчиков производительности:
В следующей таблице описываются отслеживаемые счетчики производительности:
Счетчики производительности | Описание |
---|---|
Память(*)\Available Bytes | Доступные байты — это объем физической памяти в байтах, который сразу же доступен для выделения в процессе или для использования системой. |
Сетевой интерфейс(*)\Всего байт/с | Скорость отправки и получения байтов по каждому сетевому адаптеру, включая символы кадрирования. Всего байт/с — это сумма байт получено/с и байт отправлено/с. |
Процессор(_Всего)% времени работы процессора | Процент истекшего времени, когда все потоки обработки использовали обработчик для выполнения инструкций. |
Активность RDMA(*)\Входящие байты/сек | Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду. |
Действие RDMA(*)\исходящие байты RDMA в секунду | Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду. |
После включения Аналитики может потребоваться до 15 минут для сбора данных. После завершения процесса вы сможете увидеть многофункциональную визуализацию работоспособности кластера из меню "Аналитика " на левой панели:
Отключение инсайтов
Чтобы отключить Аналитику, выполните следующие действия.
При отключении функции Insights связь между правилом сбора данных и кластером удаляется, и журналы службы работоспособности и управления SDDC больше не собираются. Однако существующие данные не удаляются. Если вы хотите удалить эти данные, перейдите в рабочую область DCR и Log Analytics и удалите эти данные вручную.
Обновить аналитические данные
На плитке данных Insights отображается сообщение "Требуется обновление" в следующих случаях:
- Правило сбора данных изменено.
- Событие состояния системы из журнала событий Windows удаляется.
- Удаляется любой из пяти счетчиков производительности из рабочей области Log Analytics .
Чтобы включить аналитику снова, выполните следующие действия.
Выберите плитку Insights в разделе "Возможности".
Нажмите кнопку "Обновить", чтобы просмотреть визуализации снова.
Переход от Microsoft Monitoring Agent
Чтобы перейти из Microsoft Monitoring Agent (MMA) в агент мониторинга Azure (AMA), прокрутите вниз до Insights.
Выберите Установить AMA; откроется окно конфигурации Insights.
Выберите или создайте правило сбора данных, как описано ранее в разделе Enable Insights .
Агент Azure Monitor и расширение Microsoft Monitoring Agent можно установить на одном компьютере во время миграции. Одновременное выполнение обоих агентов может привести к дублированию данных и увеличению затрат. Если на компьютере установлены оба агента, в портале Azure появится предупреждение о том, что вы можете собирать повторяющиеся данные, как показано на следующем снимке экрана.
Предупреждение
Сбор дублирующих данных с одного компьютера с помощью агента Azure Monitor и расширения Microsoft Monitoring Agent может привести к дополнительным затратам на отправку и обработку дублирующих данных в рабочую область Log Analytics.
Необходимо удалить расширение Microsoft Monitoring Agent самостоятельно с любых компьютеров, использующих его. Прежде чем выполнить этот шаг, убедитесь, что компьютер не зависит от других решений, требующих Microsoft Monitoring Agent. Убедившись, что MicrosoftMonitoringAgent еще не подключен к рабочей области Log Analytics, вы можете удалить MicrosoftMonitoringAgent вручную, перейдя на страницу расширений.
Устранение неполадок
В этом разделе приводятся рекомендации по устранению проблем с использованием Аналитики для Azure Stack HCI.
Диагностика и устранение неисправностей кластеров, зарегистрированных до ноября 2023 г.
Проблема. В кластерах, зарегистрированных до ноября 2023 года, функции, использующие AMA в Azure Stack HCI, такие как Arc для серверов, VM Insights, Container Insights, Defender для облака и Sentinel, могут не собирать журналы и данные событий должным образом.
Причина. До ноября 2023 года регистрация кластера настраивала AMA для использования удостоверения кластера, а службы, использующие AMA в Azure Stack HCI, требовали удостоверения узла кластера для правильного сбора журналов. Это несоответствие привело к неправильному сбору журналов из этих служб.
Решение. Чтобы устранить эту проблему, мы внесли изменения в регистрацию кластера HCI в системе AMA, чтобы использовать удостоверение сервера. Чтобы реализовать это изменение, выполните следующие действия по кластерам, зарегистрированным до ноября 2023 г.:
- Восстановление регистрации кластера. См. раздел "Восстановление регистрации кластера".
- Восстановление AMA. См. раздел "Восстановление AMA".
- Перенастройте Инсайты для Azure Stack HCI. См. Reconfigure Insights для Azure Stack HCI.
В портале Azure страница Insights для Azure Stack HCI автоматически обнаруживает изменение конфигурации AMA и отображает баннер в верхней части страницы, руководствуя вас для выполнения необходимых действий для продолжения использования служб, зависящих от AMA.
Восстановление регистрации кластера
Выполните следующие действия, чтобы восстановить регистрацию кластера:
На узлах кластера установите последний
Az.StackHCI
модуль PowerShell. Заменитеlatestversion
последнимAz.StackHCI
номером версии.Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force
Выполните команду восстановления регистрации, чтобы удалить ключ реестра:
Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration
Восстановление AMA для Azure Stack HCI
Выберите один из следующих вариантов для восстановления AMA:
Вариант 1. Удаление AMA
Если AMA уже обновлена, удалите его. Выполните следующие действия, чтобы удалить AMA:
Вариант 2. Обновление AMA
Выполните следующие действия, чтобы обновить AMA:
Вариант 3. Перезапуск AMA
Выполните следующие действия на всех узлах кластера, чтобы перезапустить AMA:
Выполните следующую команду, чтобы отключить AMA:
cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number> AzureMonitorAgentExtension.exe disable
После завершения исполняемого файла и остановки всех процессов AMA выполните следующую команду, чтобы перезапустить агент:
AzureMonitorAgentExtension.exe enable
Вариант 4. Перезагрузка узлов кластера
Перенастройка аналитических отчетов для Azure Stack HCI
Выполните следующие действия, чтобы перенастроить Insights для Azure Stack HCI:
портал Azure На странице "Аналитика" кластера Azure Stack HCI отображается баннер в верхней части экрана, как показано на следующем снимке экрана, который помогает снова настроить аналитику и связать DCR с узлами кластера. Просмотрите баннер и выберите "Настроить Аналитику".
Перенастройка DCR. Следуйте инструкциям по настройке Аналитики, как описано в этой статье. См. статью "Настройка Аналитики для Azure Stack HCI".
Как устранить неполадки с пустой страницей рабочей книги, где данные не загружены
Проблема. Вы увидите пустую страницу рабочих книг с пустыми данными, как показано на следующем снимке экрана.
Возможные причины. Может быть несколько возможных причин этой проблемы, включая недавнюю конфигурацию Insights, неполные шаги по устранению неполадок для кластеров, зарегистрированных до ноября 2023 года, или связанные DCR не настроены должным образом.
Решение. Чтобы устранить проблему, выполните следующие действия в последовательности:
- Если вы недавно настроили Insights, подождите до одного часа, пока AMA будет собирать данные.
- Если после ожидания данные по-прежнему отсутствуют, убедитесь, что вы выполнили все действия, описанные в разделе "Устранение неполадок" кластеров, зарегистрированных до ноября 2023 года.
- Проверьте конфигурацию связанного DCR. Убедитесь, что каналы событий и счетчики производительности добавляются в качестве источников данных в связанный DCR, как описано в разделе "Правила сбора данных".
- Если проблема сохраняется после выполнения описанных выше действий, и вы по-прежнему не видите никаких данных, обратитесь в службу поддержки клиентов за помощью.
Для получения более подробных сведений по устранению неполадок см. Руководство по устранению неполадок для агента Azure Monitor.
Визуализации инсайтов
После включения Аналитики в следующих таблицах содержатся сведения обо всех ресурсах.
Здоровье
Предоставляет ошибки работоспособности в кластере.
Метрика | Описание | Единица | Пример |
---|---|---|---|
Неисправность | Краткое описание сбоев работоспособности. Щелкнув ссылку, откроется боковая панель с дополнительными сведениями. | Нет единицы | ПревышенПорогВместимостиПула |
Тип ресурса сбоя | Тип ресурса, который столкнулся с ошибкой. | Нет единицы | StoragePool |
Идентификатор ресурса сбоя | Уникальный идентификатор ресурса, у которого обнаружена ошибка работоспособности. | Уникальный идентификатор | {a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1}: SP:{b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2} |
Серьезность | Серьезность сбоя может быть предупреждением или критически важной. | Нет единицы | Предупреждение |
Начальное время сбоя | Метка времени последнего обновления сервера. | Дата и время | 4.9.2022, 12:15:42 |
Сервер
Метрика | Описание | Единица. | Пример |
---|---|---|---|
Серверы | Имена серверов в кластере. | Нет единицы | VM-1 |
Последнее обновление | Дата и время последнего обновления сервера. | Дата и время | 4.9.2022, 12:15:42 после полудня |
Состояние | Работоспособность ресурсов сервера в кластере. | Это может быть здорово, предупреждение, критическое и другое | Здоровый |
Использование процессора | Процент времени, когда процесс использовал ЦП. | Процент | 56 % |
Использование памяти | Использование памяти серверного процесса равно сумме счетчика Process\Private Bytes и размера сопоставленных с памятью данных. | Процент | 16 % |
Логические процессоры | Количество логических процессоров. | Количество | 2 |
ЦП | Количество ЦП. | Счёт | 2 |
Время безотказной работы | Время, в течение которого машина, особенно компьютер, работает. | Временной диапазон | 2.609 ч. |
Сайт | Имя сайта, к которому принадлежит сервер. | Имя сайта | SiteA |
Доменное имя | Локальный домен, к которому принадлежит сервер. | Нет единицы | Contoso.local |
Виртуальные машины
Предоставляет состояние всех виртуальных машин в кластере. Виртуальная машина может находиться в одном из следующих состояний: выполнение, остановка, сбой или другое (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка).
Метрика | Описание | Единица | Пример |
---|---|---|---|
Серверы | Имени сервера. | Нет единицы | Sample-VM-1 |
Последнее обновление | Это дает дату и время последнего обновления сервера | Дата и время | 4.9.2022, 12:24:02 |
Общее число виртуальных машин | Количество виртуальных машин на узле сервера. | Подсчет | 0 из 0 запущено |
Выполняется | Количество виртуальных машин, работающих на узле сервера. | Считать | 2 |
Остановлено | Количество виртуальных машин, остановленных на узле сервера. | Счёт | 3 |
Неудачно | Количество виртуальных машин, которые вышли из строя на серверном узле. | Подсчёт | 2 |
Другие | Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка), она считается другой. | Считать | 2 |
Хранилище
В следующей таблице приведены сведения о работоспособности томов и дисков в кластере:
Метрика | Описание | Единица | Пример |
---|---|---|---|
Объемы | Имя тома | Нет единицы | ИсторияПроизводительностиКластера |
Последнее обновление | Дата и время последнего обновления хранилища. | Дата и время | 14.04.2022, 14:58:55 |
Состояние | Состояние тома. | Нормально, предупреждение, критическое и другое. | Здоровый |
Общая вместимость | Общая емкость устройства в байтах за отчетный период. | Байт | 2.5 ГБ |
Доступная емкость | Доступная емкость в байтах в отчетный период. | Байт | 20 Б |
Iops | Количество операций ввода-вывода в секунду. | в секунду. | 45/с |
Пропускная способность | Количество байтов в секунду, обрабатываемых Шлюзом приложений | Байты в секунду | 5B/с |
Задержка | Время выполнения запроса ввода-вывода. | Секунда | 0.0016 s |
Устойчивость | Способность восстанавливаться после сбоев. Обеспечивает максимальную доступность данных. | Нет единицы | Трехстворчатое зеркало |
Дедупликация | Процесс уменьшения физического числа байтов данных, которые должны храниться на диске. | Доступно или нет | Да/нет |
Файловая система | Тип файловой системы. | Нет единицы | ReFS |
Цены на Azure Monitor
При включении визуализации мониторинга журналы собираются из:
- Управление работоспособностью (Microsoft-windows-health/operational).
- Управление SDDC (Microsoft-Windows-SDDC-Management/Operational; Идентификатор события: 3000, 3001, 3002, 3003, 3004).
Плата взимается на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.
Azure Monitor имеет плату по мере использования, и первые 5 ГБ на учётную запись в месяц бесплатны. Так как цены могут отличаться из-за нескольких факторов, таких как регион Azure, который вы используете, посетите калькулятор цен Azure Monitor для наиболее актуальных вычислений цен.