Поделиться через


Мониторинг управляемых пулов DevOps

Управляемые пулы DevOps предоставляют несколько вариантов мониторинга экземпляров пула. Страница "Обзор" содержит предопределенные диаграммы метрик и можно настроить пользовательские диаграммы на странице метрик. Используйте эти средства для мониторинга работоспособности экземпляров управляемых пулов DevOps.

Доступные метрики

Управляемые пулы DevOps предоставляют следующие метрики:

Метрика Единица измерения Агрегаты Dimensions
AllocationDurationMS
Средняя длительность запроса пула
Миллисекунды По средней Image, , PoolIdResourceRequestTypeType
Выделенных
Число агентов Azure DevOps с заданиями, работающими в настоящее время
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
NotReady
Количество агентов Azure DevOps, которые не настроены для тестирования
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
ОжиданиеReimage
Количество агентов Azure DevOps в процессе повторного переимыка
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
ОжиданиеReturn
Число агентов Azure DevOps, которые выполняются после очистки, ожидая удаления (которые происходят в пакетах)
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
Подготовлено
Число агентов Azure DevOps в настоящее время
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
Готово
Количество агентов Azure DevOps, которые готовы принять задание
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
Запуск
Количество подготовленных агентов Azure DevOps
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
Всего
Общее количество агентов Azure DevOps
Count Среднее, Мин., Макс. Images, , PoolIdProviderNameSKU
Численность
Общее количество подготовленных агентов, сгруппированных по состоянию
Count Count ErrorCode, , FailureStageRequestTypePoolIdStatus,Type

Фильтрация и разбиение

Azure Monitor поддерживает фильтрацию и разделение метрик с измерениями. Управляемые пулы DevOps предоставляют следующие измерения. См. предыдущую таблицу со списком измерений, применяемых для конкретной метрики.

Измерение Description
Image Имя образа
Images Список изображений
PoolId Имя управляемого пула DevOps
ProviderName Поставщик CI/CD (AzureProvider в настоящее время является единственным поставщиком)
ResourceRequestType
SKU Размер виртуальной машины
Type
ErrorCode Один из кодов ошибок, перечисленных в кодах ошибок
FailureStage
RequestType
Status Состояние агента

Фильтрация позволяет выбрать, какие значения измерения включаются в диаграмму. Может потребоваться отобразить успешные запросы при диаграмме общего числа агентов, подготавливаемых метрикой счетчика . Вы применяете фильтр к измерению состояния .

Разделение определяет, нужно ли отображать на диаграмме отдельные линии для каждого значения измерения или объединять все значения в одну линию. Разделение позволяет визуализировать, как разные сегменты метрики сопоставимы друг с другом. Вы можете увидеть одну строку для средней строки AllocationDurationMS во всех пулах или увидеть отдельные строки для каждого пула.

Дополнительные сведения см. в разделе "Анализ метрик", "Использование фильтров измерений" и "Разделение".

Просмотр метрик в обзоре управляемого пула DevOps

Страница обзора для управляемого пула DevOps содержит следующие предопределенные диаграммы метрик, которые можно задать для отображения метрик за последний час, день, 7 дней или 30 дней.

Вы можете настроить диаграммы или создать собственные. Дополнительные сведения см. в статье "Анализ метрик", "Создание диаграммы метрик".

Диаграмма использования пула

На диаграмме использования пула отображаются следующие метрики.

  • Начало: количество агентов, запускаемых и готовящихся к приему заданий.
  • Готово: количество агентов только и готово к принятию заданий.
  • Выделено: количество агентов, выполняющихся в настоящее время.
  • NotReady: количество агентов с отслеживанием состояния, которые завершили задание, но еще не готовы принять новое задание.
  • Ожиданиеreimage: количество агентов, которые завершили задание и готовятся к повторному переимыслу. Это состояние обычно, если у вас есть пул, настроенный для агентов без отслеживания состояния с включенным режимом резервного агента.
  • ОжиданиеReturn: количество агентов Azure DevOps, которые выполняются после очистки, ожидая удаления (которая происходит в пакетах)
  • Подготовлено: количество онлайн-агентов.
  • Всего: общее количество агентов.

Диаграмма работоспособности подготовки пула

На диаграмме работоспособности подготовки пула отображаются следующие метрики.

  • Count — общее количество подготовленных агентов, сгруппированных по состоянию (завершено или неудачно)

Диаграмма длительности запроса

На диаграмме "Длительность запроса" отображаются следующие метрики.

  • AllocationDurationMS — средняя длительность запроса пула

Диаграмма этапов сбоя

На диаграмме этапов сбоя отображаются следующие метрики.

  • Count — общее количество агентов, которые не удалось подготовить, сгруппированные по FailureStage

Диаграмма кодов ошибок

На диаграмме "Коды ошибок" отображаются следующие метрики .

  • Count — общее количество агентов, которые не удалось подготовить, сгруппированные по ErrorCode

Список кодов ошибок см. в следующем разделе "Коды ошибок ".

Коды ошибок

Код ошибки Сообщение об ошибке
AzureInternalServerError Не удалось выполнить выделение ВМ из-за внутренней ошибки. Повторите попытку позже или попробуйте развернуть в другом расположении.
ClusterOutOfCapacity Ошибка выделения. Обратите внимание, что выделение для этой подписки ограничено набором кластеров, которые могут быть не в емкости. Чтобы удалить ограничение кластера, обратитесь к администратору подписки или служба поддержки Майкрософт. Дополнительные сведения об улучшении вероятности успешного распределения см. в https://aka.ms/allocation-guidanceстатье .
CustomScriptError Виртуальная машина сообщила о сбое при обработке расширения CustomScript (издатель Microsoft.Compute и тип CustomScriptExtension). Сообщение об ошибке: "Завершено выполнение команды". Дополнительные сведения об устранении неполадок доступны по адресу https://aka.ms/VMExtensionCSEWindowsTroubleshoot.
DiskProcessingTimeout Обработка виртуальной машины "..." останавливается из-за одной или нескольких ошибок обработки дисков, возникших с помощью виртуальной машины "..." в той же группе доступности. Устранение ошибки с помощью виртуальной машины "..." перед повтором операции. Дополнительные сведения см. в разделе https://aka.ms/activitylog.
EndpointNotFound 404. Прослушиватели не подключены к конечной точке. TrackingId:000000000-0000-0000-0000-00000000, SystemTracker:tipresourceprovider.servicebus.windows.net:tipresourceproviderconnection/pools/es_tap_prime_cus_d4ds, Timestamp:2024-02-15T21:15:57
ExceedingQuota Превышена квота.
FailedToRetrieveUserPassword Не удалось получить пароль пользователя ... из Key Vault
ForbiddenByFirewall Запрещено
HTTPResponseBodyNotAvailable Текст ответа HTTP недоступен
ImageNotFound Не удалось найти изображение. Проверьте образ и существует версия
ImageRemovedFromPool Указанный ключ отсутствует в словаре
ImageThrottling Слишком много одновременных запросов копирования из ресурса моментального снимка или образа. Повторите попытку позже.
InstallationOfWindowsUndeployable Сбой подготовки ОС для виртуальной машины. Сведения об ошибке. Эта установка Windows является неопровержимой. Убедитесь, что изображение правильно подготовлено (обобщено). Инструкции для Windows: https://azure.microsoft.com/documentation/articles/virtual-machines-windows-upload-image/.
InsufficientCapacity Ошибка выделения. В этом регионе недостаточно емкости для запрошенного размера виртуальной машины. Дополнительные сведения об улучшении вероятности успешного распределения см. в статье https://aka.ms/allocation-guidance
InvalidSubnetDelegation Подсеть /subscriptions/{subscriptionId}/resourceGroups/{rgName}/providers/Microsoft.Network/virtualNetworks/{vnetName}/subnets/{subnetName} , на которую /subscriptions/{subscriptionId}/resourceGroups/{rgName}/providers/Microsoft.Compute/virtualMachineScaleSets/{}/updateGroups/version1/networkInterfaceConfigurations/nic/ipConfigurations/ipconfig ссылается не удается использовать, так как она содержит внешние ресурсы.
NetworkProfileProcessingTimeout Произошла непредвиденная ошибка при обработке профиля сети ВМ. Повторите попытку позже.
ProvisioningTimeOut Ресурс subscriptions/{subscriptionId}/resourceGroups/{rgName}/providers/Microsoft.Network/networkInterfaces/providers/Microsoft.Compute/virtualMachineScaleSets/{}/virtualMachines/networkInterfaces/nic не найден. Подготовка ОС для виртуальной машины не завершилась в течение выделенного времени. Виртуальная машина по-прежнему может успешно завершить подготовку. Проверьте состояние подготовки позже. Также убедитесь, что образ был надлежаще подготовлен (обобщен). Инструкции для Windows: Инструкции для Linux. https://azure.microsoft.com/documentation/articles/virtual-machines-windows-upload-image/ https://azure.microsoft.com/documentation/articles/virtual-machines-linux-capture-image/ Если развертывается более 20 Виртуальные машины одновременно, рассмотрите возможность перемещения пользовательского образа в общую коллекцию образов. Обратитесь к одному и тому https://aka.ms/movetosig же.
RemoteNameCantBeResolved
ResourceGroupBeingDeleted Группа ресурсов ... находится в состоянии отмены подготовки и не может выполнять эту операцию.
SecretDisabled Операция get не разрешена в отключенном секрете. Состояние: 403 (запрещено) ErrorCode: Запрещено
ServiceUnavailable Служба недоступна. Повторите запрос позже.
SkuNotAvailable Запрошенный размер виртуальной машины для ресурса "Следующие номера SKU не удалось выполнить для ограничений емкости:" в настоящее время недоступен в расположении. Попробуйте использовать другой размер или развернуть в другом расположении или другой зоне. Подробные сведения см. в разделе https://aka.ms/azureskunotavailable.
TaskCanceled Запрос был отменен из-за настроенного httpClient.Timeout в течение 100 секунд.
VirtualNetworkIsNotFound Может быть удалена виртуальная сеть.

См. также