Устранение неполадок с Управляемый экземпляр SCOM в Azure Monitor
В этой статье описываются ошибки, которые могут возникнуть при развертывании или использовании SCOM Azure Monitor Управляемый экземпляр и их устранении.
Сценарий: создание и развертывание Управляемый экземпляр SCOM
Общие действия по устранению неполадок
- Убедитесь, что выполнены все предварительные условия. Проблемы с созданием могут возникнуть из-за неправильных или неполных предварительных требований.
- Убедитесь, что вы внимательно считываете или проверяете сообщение об ошибке. Сообщения об ошибках фиксируют проблему или ошибку при создании.
- Проверьте ссылку на журналы установки SCOM, указанную в сообщении об ошибке. Выберите ссылку, чтобы скачать журналы установки System Center Operations Manager. Анализ журналов для выявления и устранения ошибок и сбоев.
- Если не удается определить проблему, выполнив указанные выше действия, войдите в экземпляр Масштабируемые наборы виртуальных машин и проверьте журналы в разделе C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.ScomServer.ScomServerForWindows<>, что помогает определить проблему.
- Если проблема сохраняется, вызовите запрос в службу поддержки со всеми соответствующими сведениями [
correlation-id
,subscription-id
и т. д.]
Проблема. Группа %ResourceGroupName%
ресурсов управляется другим ресурсом Azure
Причина. Возникает, когда для группы ресурсов задано свойство ManagedBy .
Разрешение. Укажите другую группу ресурсов с свойством ManagedBy как пустую.
Проблема. Выбранная подсеть %SubnetName%
выделена для другой службы
Причина. Возникает, когда в подсети есть делегирования.
Разрешение. Укажите подсеть, которая не делегирована какой-либо другой службе.
Проблема. Ошибка, когда Управляемый экземпляр SCOM не может получить доступ к Управляемый экземпляр SQL %instance%
Причина: эта ошибка может быть вызвана любой из следующих причин:
- Отсутствует видимость линии видимости из SCOM Управляемый экземпляр виртуальной сети в конечную точку Управляемый экземпляр SQL.
- Отсутствует правильный уровень правил NSG, чтобы разрешить трафик через Управляемый экземпляр SQL общедоступную конечную точку.
- MSI не добавляется в качестве администратора Active Directory.
- Управляемый экземпляр SCOM может не иметь разрешений на чтение Управляемый экземпляр SQL.
- Может возникнуть проблема с виртуальной сетью или регионом.
Решение.
- Предоставьте разрешение на чтение Управляемый экземпляр SQL.
- MSI необходимо добавить в качестве администратора Active Directory в Управляемый экземпляр SQL.
- Убедитесь, что подключение между SCOM Управляемый экземпляр и сетями Управляемый экземпляр SQL. Дополнительные сведения см. в статье "Создание и настройка Управляемый экземпляр SQL".
Проблема. Недостаточно ядер для создания %instance%
в данном регионе
Причина. Возникает, когда недостаточно ядер для создания экземпляра в заданном регионе.
Разрешение. При необходимости проверьте раздел квоты на портал Azure и выделите больше ядер типа Standard Ds3v2 в регионе.
Проблема. Секретный ключ с тем же именем уже присутствует в хранилище ключей
Причина. Возникает, когда другой секретный ключ с тем же именем уже присутствует в хранилище ключей.
Разрешение. Изменение имени экземпляра.
Проблема: виртуальная машина сообщила о сбое при подключении модуля joindomain
обработки к домену %DomainName%
Причина: возникает из-за следующих причин:
- Видимость видимости от SCOM Управляемый экземпляр Server к контроллеру домена.
- Учетные данные пользователя домена не предоставляются или не указаны.
- Путь к подразделению для домена AD не указан.
Решение. Проверьте причину и, соответственно, попробуйте устранить проблему.
Проблема: статический IP-адрес уже используется
Причина. Возникает, если статический IP-адрес используется другим экземпляром.
Разрешение. Используйте другой статический IP-адрес.
Проблема: недопустимый тип удостоверения %identityType%
Причина. Возникает из-за неправильного управляемого удостоверения.
Разрешение. Укажите один из возможных типов удостоверений ((None), (SystemAssigned,UserAssigned)) и повторите попытку.
Проблема. Частный статический IP-адрес %LbIpAddr%
не принадлежит диапазону подсети %subnet%
Причина. Возникает, так как IP-адрес отсутствует в диапазоне подсети.
Разрешение. Укажите доступный IP-адрес из диапазона подсети и повторите операцию.
Проблема. Удостоверение не является системным администратором в Управляемый экземпляр SQL: "%instance".
Причина: возникает из-за следующих причин:
- Управляемое удостоверение пользователя не является администратором SQL в SQL MI.
- Управляемое удостоверение пользователя подтверждается администратором SQL в SQL MI, и оно развертывается с помощью ARM, BICEP, Terraform или другого решения развертывания.
Разрешение. Убедитесь, что управляемое удостоверение пользователя развертывается с помощью AppId, а не ObjectId. Вы можете убедиться, что это применимо, перейдя к панели администрирования ИДЕНТИФИКАТОРа Microsoft Entra. Проверьте, является ли guid, указанный с управляемым удостоверением пользователя, объектом ObjectId или AppId субъекта-службы. Если это Объектный идентификатор:
- Настройка его с помощью портала
- Повторное развертывание с помощью предпочтительного решения с помощью AppId.
Сценарий. Развертывание отчетов в Power BI
Проблема: Управляемый экземпляр SQL недоступен
Причина. Происходит, если общедоступная конечная точка не включена. Power BI не сможет получить доступ к Управляемый экземпляр SQL.
Разрешение. Проверьте разрешения пользователя на Управляемый экземпляр SQL и укажите необходимые разрешения.
Проблема. Не удается обновить учетные данные набора данных
Причина. Происходит, если у пользователя нет соответствующих разрешений на Управляемый экземпляр SQL.
Разрешение. Проверьте разрешения пользователя на Управляемый экземпляр SQL и укажите необходимые разрешения.
Проблема. Отчет не удается обновить
Причина. Происходит из-за большого размера данных. Отчет может не обновляться.
Решение. Если рабочая область Power BI находится на уровне pro , измените ее на премиум или измените емкость рабочей области.
Сценарий. Увеличение или уменьшение масштаба вручную
Проблема: сбой теста подключения к Интернету. Необходимые конечные точки недоступны из виртуальной сети
Причина: проблема с сетью.
Разрешение. Убедитесь, что Управляемый экземпляр SCOM имеет исходящий доступ к Интернету и NSG/Брандмауэр правильно настроен, чтобы разрешить доступ к необходимым конечным точкам, как описано в требованиях к брандмауэру.
Проблема: превышена квота
Причина. Возникает, если для масштабирования нет ядер.
Разрешение. Увеличьте количество ядер в подписке.
При необходимости проверьте раздел квоты на портал Azure и выделите больше ядер типа Standard Ds3v2 в регионе.
Проблема: ошибка подготовки расширений
Причина. Эта ошибка может возникать во время подготовки расширения System Center Operations Manager или установки System Center Operations Manager.
Решение. Проверьте общее устранение неполадок, попробуйте определить проблему и устранить ее соответствующим образом.
Проблема: конфликт
Причина. Происходит, если выполняется исправление или масштабирование. Не удается активировать новую операцию.
Решение. Дождитесь завершения текущего процесса и повторите попытку.
Сценарий: исправление
Проблема: сбой теста подключения к Интернету. Необходимые конечные точки недоступны из виртуальной сети
Причина: проблема с сетью.
Разрешение. Убедитесь, что Управляемый экземпляр SCOM имеет исходящий доступ к Интернету и NSG/Брандмауэр правильно настроен, чтобы разрешить доступ к необходимым конечным точкам, как описано в требованиях к брандмауэру.
Проблема. Уведомление зависает при выборке обновлений , даже если операция обновления завершена
Причина: проблема с сетью или разработка.
Решение. Попробуйте обновить обновления для обновлений. Если это не разрешено, обратитесь в службу поддержки Майкрософт.
Проблема. Состояние обновления не отражается правильно на карточке
Причина: проблема с сетью или разработка.
Решение. Попробуйте обновить обновления для обновлений. Если это не разрешено, обратитесь в службу поддержки Майкрософт.
Проблема. Несоответствие элементов управления в карточке
Причина: проблема согласованности. Например, кнопка обновления включена, даже если заголовок карточки считывает SCOM в актуальном состоянии.
Разрешение. Попробуйте обновить. Если это не разрешено, обратитесь в службу поддержки Майкрософт.
Проблема: всплывающее сообщение предупреждения для обновлений
Причина: возникает из-за любой из следующих причин:
- Доступно новое обновление, и пользователь не активировал экземпляр обновления; или
- Последнее обновление завершилось сбоем, и пользователь не активировал другой экземпляр обновления.
Разрешение. Активация экземпляра обновления.
Проблема: обновление завершается сбоем после нескольких повторных попыток
Решение. Чтобы устранить проблему, обратитесь в службу поддержки Майкрософт.
Проблема. Обновление завершается ошибкой, и откат не удается оставить несогласованное состояние, в котором количество виртуальных машин в экземпляре Масштабируемые наборы виртуальных машин было изменено.
Разрешение. Перейдите в консоль System Center Operations Manager и удалите несогласованные узлы.
Проблема. Обновление завершается сбоем, но обновление базы данных успешно завершено
Причина. Происходит из-за сбоя обновления после успешного обновления базы данных.
Разрешение: повторите попытку через некоторое время.
Проблема. После успешного обновления консоль System Center Operations Manager работает неправильно в экземпляре.
Причина. Возникает, если System Center Operations Manager не установлен должным образом или некоторый процесс может застрять.
Разрешение. Попробуйте перезапустить экземпляр. Если проблема сохранится, обратитесь в службу поддержки клиентов Майкрософт.
Проблема. Обновление занимает более 3 часов и завершается сбоем в конечном итоге
Причина. Происходит, когда обновление занимает более 3 часов.
Решение. Обратитесь в службу поддержки Майкрософт.
Проблема. Некоторые периодические проблемы во время обновления
Причина. Происходит, если service fabric или RP завершает работу или перезапускается.
Разрешение: перезапустите обновление.
Проблема. Масштабирование и исправление активируется одновременно, а затем завершается сбоем
Причина. Происходит, если запросы на масштабирование и исправление отправляются и принимаются одновременно.
Решение. Если вы активировали операцию масштабирования, дождитесь завершения операции перед попыткой обновить операцию.
Проблема. Расширение занимает больше времени для обновления и сбоя
Причина. Происходит, если Управляемый экземпляр SQL и SCOM Управляемый экземпляр находятся в разных регионах, из-за которых расширение занимает больше времени для обновления и в конечном итоге завершается сбоем.
Решение: Управляемый экземпляр SQL и SCOM Управляемый экземпляр в одном регионе.
Проблема. После исправления пользовательские данные в базе данных изменяются или не сохраняются должным образом.
Причина. Происходит, если обновление не было выполнено должным образом.
Разрешение: перезапустите обновление.
Проблема: сбой запроса на исправление
Причина. Возникает из-за проблемы с порталом или ARM.
Решение: подождите некоторое время и повторите попытку. Если проблема существует даже после устранения проблемы с порталом или ARM, обратитесь в службу поддержки Майкрософт.
Проблема: операция исправления или масштабирования уже выполняется, повторите попытку через некоторое время.
Причина. Происходит, если операция исправления или масштабирования уже выполняется.
Решение. Дождитесь завершения существующей операции и попробуйте через некоторое время.
Проблема: устаревшие серверы управления, видимые на консоли
Причина. Возникает, если операция исправления или масштабирования оставила несогласованное состояние после завершения.
Решение. Microsoft Azure Масштабируемые наборы виртуальных машин используется для подготовки серверов управления для Управляемый экземпляр SCOM. Чтобы удалить устаревший сервер управления из системы, выполните следующие действия.
Перейдите к Масштабируемые наборы виртуальных машин Azure и войдите на один из серверов управления для SCOM Управляемый экземпляр.
Запустите PowerShell в административном режиме и перейдите к следующему каталогу.
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter
Примечание.
Чтобы найти версию, перейдите
C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows
к ней и просмотрите все доступные версии, а затем выберите последнюю версию.Выполните следующий скрипт:
.\RemoveStaleManagementServers.ps1
Скрипт является интерактивным и запрашивает полное доменное имя устаревшего сервера.
Укажите точное полное доменное имя устаревшего сервера управления, который вы хотите удалить.
Например, полное доменное имя: SCOMMI2000001.contoso.com.