Мониторинг одного кластера Azure Stack HCI с помощью Insights
Область применения: локальная версия Azure, версия 22H2
Внимание
Azure Stack HCI теперь является частью Azure Local. Выполняется переименование документации по продукту. Однако старые версии Azure Stack HCI, например 22H2, будут продолжать ссылаться на Azure Stack HCI и не отражают изменение имени. Подробнее.
В этой статье объясняется, как использовать Аналитику для мониторинга одного кластера Azure Stack HCI. Сведения о нескольких кластерах Azure Stack HCI см. в статье "Мониторинг нескольких кластеров Azure Stack HCI" с помощью Insights.
Аналитика — это функция Azure Monitor, которая быстро запускает мониторинг кластера Azure Stack HCI. Вы можете просматривать ключевые метрики, работоспособности и использования в кластере, серверах, виртуальных машинах и хранилище.
Внимание
Если вы зарегистрировали кластер Azure Stack HCI и настроили Insights до ноября 2023 года, некоторые функции, использующие агент Azure Monitor (AMA), такие как Arc for Servers, VM Insights, Defender для облака или Sentinel, могут неправильно собирать журналы и данные событий. Рекомендации по устранению неполадок см. в разделе "Устранение неполадок кластеров", зарегистрированных до ноября 2023 г.
Льготы
Аналитика для Azure Stack HCI предлагает следующие преимущества:
Управляется Azure. Аналитика управляется Azure и обращается через портал Azure, обеспечивая актуальность. Нет необходимости в настройке базы данных или специального программного обеспечения.
Масштабируемость. Аналитика может загружать более 400 наборов сведений о кластере в нескольких подписках одновременно. Нет ограничений на кластер, домен или физическое расположение.
Возможность настройки. Интерфейс Аналитики основан на шаблонах книг Azure Monitor. Это позволяет изменять представления и запросы, изменять или задавать пороговые значения, которые соответствуют определенным ограничениям, а затем сохранять эти настройки в книге. Затем вы можете закрепить диаграммы в книгах на панелях мониторинга Azure.
Настройка Аналитики для Azure Stack HCI
Предварительные требования и параметры для использования Аналитики зависят от используемой версии Azure Stack HCI. Выберите одну из следующих вкладок, чтобы узнать, как использовать Аналитику для конкретной версии Azure Stack HCI.
Функция Аналитики в Azure Stack HCI версии 22H2 и более поздних версиях использует AMA, которая предлагает значительные преимущества по сравнению с устаревшим агентом Microsoft Monitoring Agent (MMA), используемым в Azure Stack HCI версии 21H2 и более ранними версиями. К этим преимуществам относятся улучшенная скорость, улучшенная безопасность и улучшенная производительность. Вы можете подключить новые узлы к AMA или перенести существующие узлы из устаревшего агента в AMA.
Рекомендуется обновить систему Azure Stack HCI до версии 22H2 или более поздней, чтобы воспользоваться преимуществами возможностей аналитики с AMA.
- Azure Stack HCI версии 22H2 и более поздних версий
- Azure Stack HCI версии 21H2 и более ранних версий
Начиная с накопительного обновления за май 2023 г. для Azure Stack HCI версии 22H2 можно отслеживать локальные системы Azure Stack HCI с помощью Insights для Azure Stack HCI.
Необходимые компоненты
Ниже приведены предварительные требования для использования Insights для Azure Stack HCI:
Кластер Azure Stack HCI должен быть зарегистрирован в Azure и с поддержкой Arc. Если вы зарегистрировали кластер или после 15 июня 2021 г., это происходит по умолчанию. В противном случае необходимо включить интеграцию Azure Arc.
Кластер должен иметь azure Stack HCI версии 22H2 и накопительное обновление за май 2023 г. или более поздней версии.
Управляемое удостоверение для ресурса Azure должно быть включено. Дополнительные сведения см. в статье "Включено расширенное управление".
Включение аналитики
Включение Аналитики помогает отслеживать все кластеры Azure Stack HCI, связанные с рабочей областью Log Analytics, предоставляя полезные метрики работоспособности. Аналитика устанавливает агент Azure Monitor и помогает настроить правила сбора данных (DCR) для мониторинга кластера Azure Stack HCI.
Чтобы включить эту возможность из портал Azure, выполните следующие действия.
В портал Azure перейдите на страницу ресурсов кластера Azure Stack HCI, а затем выберите кластер. На вкладке "Возможности" выберите "Аналитика".
На странице "Аналитика " выберите " Начало работы".
Примечание.
Кнопка "Начало работы" доступна только для Azure Stack HCI версии 22H2 с накопительным обновлением или более поздним обновлением за май 2023 г. и только после включения управляемого удостоверения. В противном случае эта кнопка отключена.
На странице конфигурации Аналитики выберите существующий DCR в раскрывающемся списке правила сбора данных. DCR указывает журналы событий и счетчики производительности, которые необходимо собирать и хранить в рабочей области Log Analytics. Аналитика создает DCR по умолчанию, если он еще не существует. Включены только контроллеры домена, включенные для аналитики.
(Необязательно) Вы также можете создать новый DCR, нажав кнопку "Создать" на странице конфигурации Аналитики .
Внимание
Настоятельно рекомендуется не создавать собственный DCR. DCR, созданный аналитикой, включает специальный поток данных, необходимый для его работы. Этот DCR можно изменить для сбора дополнительных данных, таких как события Windows и Syslog. Контроллеры домена, созданные с помощью установки AMA, будут иметь префикс
AzureStackHCI-
, подключенный с именем DCR.На странице "Новое правило сбора данных" укажите имя подписки, имя DCR и конечную точку сбора данных (DCE). Контроллеры домена используются для доступа к службе конфигурации для получения связанных контроллеров домена для агента Azure Monitor. Дополнительные сведения о DCE см. в статье "Конечные точки сбора данных" в Azure Monitor.
Примечание.
Если вы используете закрытые ссылки в агенте, необходимо добавить контроллеры домена. Дополнительные сведения о параметрах сети AMA см. в разделе "Определение параметров сети агента Azure Monitor".
Нажмите кнопку Просмотреть и создать.
Если DCR еще не создан для немонитоизованного кластера, он создается с включенными счетчиками производительности и каналом журнала событий Windows.
Просмотрите окончательный экран с сводкой по имени DCR, количеству журналов событий, счетчикам производительности и имени рабочей области Log Analytics, в которой хранятся данные. Выберите Set up (Настроить).
После выбора настройки вы будете перенаправлены на страницу расширений, где можно просмотреть состояние установки агента. Настроив Insights, AMA автоматически устанавливается на всех узлах кластера.
Перейдите на страницу ресурсов кластера Azure Stack HCI и выберите кластер. Аналитика теперь отображается как настроенная на вкладке "Возможности" :
Правила сбора данных
При включении Аналитики на компьютере с агентом Azure Monitor необходимо указать DCR для использования. Дополнительные сведения о контроллерах домена см. в разделе "Правила сбора данных" в Azure Monitor.
Параметр | Description |
---|---|
Счетчики производительности | Указывает, какие счетчики производительности данных собираются из операционной системы. Этот параметр необходим для всех компьютеров. Эти счетчики производительности используются для заполнения визуализаций в книге Insights. В настоящее время в книге Insights используются пять счетчиков производительности : Memory()\Available Bytes , , Network Interface()\Bytes Total/sec , Processor(_Total)\% Processor Time RDMA Activity()\RDMA Inbound Bytes/sec иRDMA Activity()\RDMA Outbound Bytes/sec |
Канал журнала событий | Указывает, какие журналы событий Windows собираются из операционной системы. Этот параметр необходим для всех компьютеров. Журналы событий Windows используются для заполнения визуализаций в книге Insights. В настоящее время данные собираются с помощью двух каналов журнала событий Windows: - microsoft-windows-health/operational microsoft-windows-sddc-management/operational |
Рабочая область Log Analytics | Рабочая область для хранения данных. Перечислены только рабочие области с аналитикой. |
Канал событий
Microsoft-windows-health/operational
Канал Microsoft-windows-sddc-management/operational
событий Windows добавляется в рабочую область Log Analytics в журналах событий Windows.
Собирая эти журналы, Аналитика показывает состояние работоспособности отдельных серверов, дисков, томов и виртуальных машин. По умолчанию добавляются пять счетчиков производительности.
Счетчики производительности
По умолчанию добавляются пять счетчиков производительности:
В следующей таблице описываются отслеживаемые счетчики производительности:
Счетчики производительности | Description |
---|---|
Memory(*)\Available Bytes | Доступные байты — это объем физической памяти в байтах, который сразу же доступен для выделения в процессе или для использования системой. |
Сетевой интерфейс(*)\Всего байт/с | Скорость отправки и получения байтов по каждому сетевому адаптеру, включая символы кадрирования. Всего байтов в секунду — это сумма полученных байтов/с и байтов, отправленных/с. |
Процессор(_общий объем ресурсов)% загруженности процессора | Процент истекшего времени, когда все потоки обработки использовали обработчик для выполнения инструкций. |
RDMA Activity(*)\RDMA Inbound Bytes/sec | Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду. |
Действие RDMA(*)\исходящие байты RDMA/с | Скорость передачи данных по протоколу RDMA сетевым адаптером в секунду. |
После включения Аналитики может потребоваться до 15 минут для сбора данных. После завершения процесса вы сможете увидеть многофункциональную визуализацию работоспособности кластера из меню "Аналитика " на левой панели:
Отключение аналитики
Чтобы отключить Аналитику, выполните следующие действия.
При отключении функции Insights связь между правилом сбора данных и кластером удаляется, а журналы управления SDDC и служба работоспособности больше не собираются. Однако существующие данные не удаляются. Если вы хотите удалить эти данные, перейдите в рабочую область DCR и Log Analytics и удалите эти данные вручную.
Update Insights
На плитке Insights отображается сообщение об обновлении "Потребности" в следующих случаях:
- Правило сбора данных изменено.
- Событие работоспособности из журнала событий Windows удаляется.
- Удаляется любой из пяти счетчиков производительности из рабочей области Log Analytics .
Чтобы включить аналитику снова, выполните следующие действия.
Выберите плитку Insights в разделе "Возможности".
Нажмите кнопку "Обновить", чтобы просмотреть визуализации снова.
Миграция из Microsoft Monitoring Agent
Чтобы перейти из Microsoft Monitoring Agent (MMA) в агент мониторинга Azure (AMA), прокрутите вниз до Insights.
Выберите " Установить AMA", откроется окно конфигурации Insights.
Выберите или создайте правило сбора данных, как описано ранее в разделе Enable Insights .
Агент Azure Monitor и расширение Microsoft Monitoring Agent можно установить на одном компьютере во время миграции. Выполнение обоих агентов может привести к дублированию данных и увеличению затрат. Если на компьютере установлены оба агента, появится предупреждение в портал Azure, которое может собирать повторяющиеся данные, как показано на следующем снимке экрана.
Предупреждение
Сбор повторяющихся данных с одного компьютера с помощью агента Azure Monitor и расширения Microsoft Monitoring Agent может привести к дополнительным затратам приема данных от отправки повторяющихся данных в рабочую область Log Analytics.
Необходимо удалить расширение Microsoft Monitoring Agent самостоятельно с любых компьютеров, использующих его. Прежде чем выполнить этот шаг, убедитесь, что компьютер не зависит от других решений, требующих Microsoft Monitoring Agent. Убедившись, что MicrosoftMonitoringAgent еще не подключен к рабочей области Log Analytics, вы можете удалить MicrosoftMonitoringAgent вручную, перейдя на страницу расширений.
Устранение неполадок
В этом разделе приводятся рекомендации по устранению проблем с использованием Аналитики для Azure Stack HCI.
Устранение неполадок кластеров, зарегистрированных до ноября 2023 г.
Выпуск. В кластерах, зарегистрированных до ноября 2023 года, функции, использующие AMA в Azure Stack HCI, такие как Arc для серверов, VM Insights, Container Insights, Defender для облака и Sentinel, могут не собирать журналы и данные событий должным образом.
Причина. До ноября 2023 года регистрация кластера настраивает AMA для использования удостоверения кластера, а службы, использующие AMA в Azure Stack HCI, требуют удостоверения узла кластера для правильной коллекции журналов. Это несоответствие привело к неправильному сбору журналов из этих служб.
Решение. Чтобы устранить эту проблему, мы внесли изменения в регистрацию кластера HCI для AMA, чтобы использовать удостоверение сервера. Чтобы реализовать это изменение, выполните следующие действия по кластерам, зарегистрированным до ноября 2023 г.:
- Восстановление регистрации кластера. См. раздел "Восстановление регистрации кластера".
- Восстановление AMA. См. раздел "Восстановление AMA".
- Перенастройка Аналитики для Azure Stack HCI. См. статью "Reconfigure Insights для Azure Stack HCI".
В портал Azure страница Insights для Azure Stack HCI автоматически обнаруживает изменение конфигурации AMA и отображает баннер в верхней части страницы, что позволяет выполнять необходимые действия для продолжения использования служб, использующих AMA.
Восстановление регистрации кластера
Выполните следующие действия, чтобы восстановить регистрацию кластера:
На узлах кластера установите последний
Az.StackHCI
модуль PowerShell. Заменитеlatestversion
последнимAz.StackHCI
номером версии.Install-Module -Name Az.StackHCI -RequiredVersion {latestversion} -Scope CurrentUser -Repository PSGallery -Force
Выполните команду регистрации восстановления, чтобы удалить regkey:
Register-AzStackHCI -TenantId {TenantID} -SubscriptionId {subscriptionID} -ComputerName {NodeName} -RepairRegistration
Восстановление AMA для Azure Stack HCI
Выберите один из следующих вариантов для восстановления AMA:
Вариант 1. Удаление AMA
Если AMA уже обновлена, удалите его. Выполните следующие действия, чтобы удалить AMA:
Вариант 2. Обновление AMA
Выполните следующие действия, чтобы обновить AMA:
Вариант 3. Перезапуск AMA
Выполните следующие действия на всех узлах кластера, чтобы перезапустить AMA:
Выполните следующую команду, чтобы отключить AMA:
cd C:\Packages\Plugins\Microsoft.Azure.Monitor.AzureMonitorWindowsAgent\<agent version number> AzureMonitorAgentExtension.exe disable
После завершения исполняемого файла и остановки всех процессов AMA выполните следующую команду, чтобы перезапустить агент:
AzureMonitorAgentExtension.exe enable
Вариант 4. Перезагрузка узлов кластера
Перенастройка Аналитики для Azure Stack HCI
Выполните следующие действия, чтобы перенастроить Insights для Azure Stack HCI:
портал Azure На странице "Аналитика" кластера Azure Stack HCI отображается баннер в верхней части экрана, как показано на следующем снимке экрана, который помогает снова настроить аналитику и связать DCR с узлами кластера. Просмотрите баннер и выберите "Настроить Аналитику".
Перенастройка DCR. Следуйте инструкциям по настройке Аналитики, как описано в этой статье. См. статью "Настройка Аналитики для Azure Stack HCI".
Устранение неполадок с пустой страницей книг без заполнения данных
Выпуск. Вы увидите пустую страницу книг без заполненных данных, как показано на следующем снимке экрана:
Возможные причины. Может возникнуть несколько возможных причин этой проблемы, включая последнюю конфигурацию Insights, неполные действия по устранению неполадок для кластеров, зарегистрированных до ноября 2023 года, или связанные С DCR не настроены должным образом.
Решение. Чтобы устранить проблему, выполните следующие действия в последовательности:
- Если вы недавно настроили Insights, подождите до одного часа, пока AMA будет собирать данные.
- Если после ожидания данные по-прежнему отсутствуют, убедитесь, что вы выполнили все действия, описанные в разделе "Устранение неполадок" кластеров, зарегистрированных до ноября 2023 года.
- Проверьте конфигурацию связанного DCR. Убедитесь, что каналы событий и счетчики производительности добавляются в качестве источников данных в связанный DCR, как описано в разделе "Правила сбора данных".
- Если проблема сохраняется после выполнения описанных выше действий, и вы по-прежнему не видите никаких данных, обратитесь в службу поддержки клиентов за помощью.
Дополнительные сведения об устранении неполадок см . в руководстве по устранению неполадок агента Azure Monitor.
Визуализации аналитики
После включения Аналитики в следующих таблицах содержатся сведения обо всех ресурсах.
Работоспособность
Предоставляет ошибки работоспособности в кластере.
Метрическая | Description | Ед. изм. | Пример |
---|---|---|---|
Неисправность | Краткое описание сбоев работоспособности. Щелкнув ссылку, откроется боковая панель с дополнительными сведениями. | Нет единицы | PoolCapacityThresholdExceed |
Тип ресурса сбоя | Тип ресурса, который столкнулся с ошибкой. | Нет единицы | StoragePool |
Идентификатор ресурса сбоя | Уникальный идентификатор ресурса, который столкнулся с ошибкой работоспособности. | Уникальный идентификатор | {a0a0a0a0-bbbb-cccc-ddddd-e1e1e1e1e1e1}: SP:{b1b1b1b1b1b1-cccc-dddd-eeee-f2f2f2f2f2f2f2f2f2f2f2f2} |
Важность | Серьезность сбоя может быть предупреждением или критическим. | Нет единицы | Предупреждение |
Начальное время сбоя | Метка времени последнего обновления сервера. | Datetime | 4.9.2022, 12:15:42 |
Сервер
Метрическая | Description | Ед. изм. | Пример |
---|---|---|---|
Серверы | Имена серверов в кластере. | Нет единицы | VM-1 |
Последнее обновление | Дата и время последнего обновления сервера. | Datetime | 4.9.2022, 12:15:42 |
Состояние | Работоспособность ресурсов сервера в кластере. | Это может быть здорово, предупреждение, критическое и другое | Работоспособно |
Использование процессора | Процент времени, когда процесс использовал ЦП. | Процент | 56 % |
Использование памяти | Использование памяти сервера равно счетчику Process\Private Bytes плюс размер сопоставленных с памятью данных. | Процент | 16 % |
Логические процессоры | Количество логических процессоров. | Count | 2 |
ЦП | Количество ЦП. | Count | 2 |
Время работы | Время, в течение которого компьютер, особенно компьютер, работает. | Временной диапазон | 2.609 ч. |
Сайт | Имя сайта, к которому принадлежит сервер. | Имя сайта | SiteA |
Доменное имя | Локальный домен, к которому принадлежит сервер. | Нет единицы | Contoso.local |
Виртуальные машины
Предоставляет состояние всех виртуальных машин в кластере. Виртуальная машина может находиться в одном из следующих состояний: выполнение, остановка, сбой или другое (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка).
Метрическая | Description | Ед. изм. | Пример |
---|---|---|---|
Серверы | Имени сервера. | Нет единицы | Sample-VM-1 |
Последнее обновление | Это дает дату и время последнего обновления сервера | Datetime | 4.9.2022, 12:24:02 |
Общее число виртуальных машин | Количество виртуальных машин на узле сервера. | Count | 0 из 0 запущено |
Выполняется | Количество виртуальных машин, работающих на узле сервера. | Count | 2 |
Остановлено | Количество виртуальных машин, остановленных на узле сервера. | Count | 3 |
Неудачно | Количество виртуальных машин не удалось выполнить на узле сервера. | Count | 2 |
Другие | Если виртуальная машина находится в одном из следующих состояний (неизвестно, запуск, моментальный снимок, сохранение, остановка, приостановка, возобновление, приостановка, приостановка), она считается другой. | Count | 2 |
Хранилище
В следующей таблице приведены сведения о работоспособности томов и дисков в кластере:
Метрическая | Description | Ед. изм. | Пример |
---|---|---|---|
Объемы | Имя тома | Нет единицы | ClusterPerformanceHistory |
Последнее обновление | Дата и время последнего обновления хранилища. | Datetime | 4.14.2022, 2:58:55 |
Состояние | Состояние тома. | Работоспособно, предупреждение, критическое и другое. | Работоспособно |
Общая загрузка | Общая емкость устройства в байтах за отчетный период. | Байт | 2.5 ГБ |
Доступная емкость | Доступная емкость в байтах в отчетный период. | Байт | 20 Б |
Iops | Количество операций ввода-вывода в секунду. | посекундно. | 45/с |
Пропускная способность | Количество байтов в секунду, обрабатываемых Шлюзом приложений | Байты в секунду | 5B/с |
Задержка | Время выполнения запроса ввода-вывода. | Second | 0.0016 s |
Устойчивость | Емкость для восстановления после сбоев. Обеспечивает максимальную доступность данных. | Нет единицы | Трехсторонние зеркальные отображения |
Дедупликация | Процесс уменьшения физического числа байтов данных, которые должны храниться на диске. | Доступно или нет | Да/нет |
Файловая система | Тип файловой системы. | Нет единицы | ReFS |
Цены на Azure Monitor
При включении визуализации мониторинга журналы собираются из:
- Управление работоспособностью (Microsoft-windows-health/operational).
- Управление SDDC (Microsoft-Windows-SDDC-Management/Operational; Идентификатор события: 3000, 3001, 3002, 3003, 3004).
Плата взимается на основе объема приема данных и параметров хранения данных рабочей области Log Analytics.
Azure Monitor имеет цены на оплату по мере использования, и первые 5 ГБ за учетную запись выставления счетов в месяц бесплатны. Так как цены могут отличаться из-за нескольких факторов, таких как регион Azure, который вы используете, посетите калькулятор цен Azure Monitor для наиболее актуальных вычислений цен.