Compartilhar via


Solucionar problemas com a Instância Gerenciada SCOM do Azure Monitor

Este artigo descreve os erros que podem ocorrer quando você implanta ou usa a Instância Gerenciada SCOM do Azure Monitor e como resolvê-los.

Cenário: criação/implantação da Instância Gerenciada do SCOM

Solução de problemas gerais

  1. Verifique se todos os pré-requisitos foram atendidos. Problemas de criação podem surgir devido a pré-requisitos inadequados/incompletos.
  2. Certifique-se de ler/verificar a mensagem de erro com cuidado. As mensagens de erro capturam o problema/erro na criação.
  3. Verifique os logs de Instalação do SCOM link fornecido na mensagem de erro. Selecione o link para baixar os logs de instalação do System Center Operations Manager. Analise os logs para identificar e resolver erros/falhas.
  4. Se você não conseguir identificar o problema com as etapas acima, entre na instância dos Conjuntos de Dimensionamento de Máquinas Virtuais e verifique os logs em C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows<versão>, o que ajuda a identificar o problema.
  5. Se o problema persistir, crie um tíquete de suporte com todos os detalhes relevantes [correlation-id, subscription-ide assim por diante]

Problema: o grupo de recursos %ResourceGroupName% é gerenciado por outro recurso do Azure

Causa: ocorre quando a propriedade ManagedBy é definida para o grupo de recursos.

Resolução: forneça outro grupo de recursos com propriedade ManagedBy como vazia.

Problema: a sub-rede %SubnetName% selecionada é dedicada a outro serviço

Causa: ocorre quando a sub-rede tem delegações.

Resolução: forneça uma sub-rede, que não é delegada a nenhum outro serviço.

Problema: erro quando a Instância Gerenciada de SCOM não consegue acessar a Instância Gerenciada de SQL %instance%

Causa: esse erro pode ser causado por qualquer um dos seguintes motivos:

  • Visibilidade de linha de visão ausente da VNet da Instância Gerenciada do SCOM para o ponto de extremidade da Instância Gerenciada de SQL.
  • Falta o nível certo das regras NSG para permitir o tráfego pelo ponto de extremidade público da Instância Gerenciada de SQL.
  • A MSI não é adicionada como administrador do Active Directory.
  • A Instância Gerenciada de SCOM pode não ter permissões de leitura na Instância Gerenciada de SQL.
  • Pode haver um problema com sua VNet/Região.

Resolução:

  • Forneça permissão de leitura para a Instância Gerenciada de SQL.
  • A MSI deve ser adicionada como administrador do Active Directory na Instância Gerenciada de SQL.
  • Verifique a conectividade entre a Instância Gerenciada de SCOM e as redes da Instância Gerenciada de SQL. Para obter mais informações, consulte Criar e configurar uma Instância Gerenciada de SQL.

Problema: não há núcleos suficientes para criar %instance% na região fornecida

Causa: ocorre quando não há núcleos suficientes para criar uma instância na região fornecida.

Resolução: verifique a seção de cota no portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: a chave secreta com o mesmo nome já está presente no cofre de chaves

Causa: ocorre quando outra chave secreta com o mesmo nome já está presente no cofre de chaves.

Resolução: altere o nome da instância.

Problema: a VM relatou uma falha ao processar a extensão joindomain ingressar no domínio %DomainName%

Causa: ocorre devido aos seguintes motivos:

  1. Visibilidade de linha de visão do Servidor de Instância Gerenciada do SCOM para o Controlador de Domínio.
  2. As Credenciais do Usuário de Domínio não são fornecidas ou incorretas.
  3. O caminho da UO para o Domínio do AD não é fornecido.

Resolução: verifique a causa e tente resolver o problema adequadamente.

Problema: IP estático já em uso

Causa: ocorre se o IP estático está sendo usado por outra instância.

Resolução: use outro IP estático.

Problema: tipo de identidade inválido %identityType%

Causa: ocorre devido à identidade gerenciada incorreta.

Resolução: forneça um dos possíveis tipos de identidade ((Nenhum), (SystemAssigned,UserAssigned)) e tente novamente.

Problema: o endereço IP estático privado %LbIpAddr% não pertence ao intervalo de sub-rede%subnet%

Causa: ocorre porque o endereço IP não está no intervalo de sub-rede.

Resolução: forneça um IP disponível no intervalo de sub-rede e repita a operação.

Problema: a identidade não é um administrador do sistema na Instância Gerenciada de SQL: '%instance'.

Causa: ocorre devido aos seguintes motivos:

  1. A Identidade Gerenciada do Usuário não é administrador do SQL no MI do SQL.
  2. A Identidade Gerenciada do Usuário é confirmada como Administrador do SQL no SQL MI e ela é implantada usando ARM, BICEP, Terraform ou outra solução de implantação.

Resolução: verifique se a Identidade Gerenciada do Usuário está implantada usando a AppId e não a ObjectId. Você pode confirmar se isso é aplicável navegando até o MI do SQL, painel de administração do Microsoft Entra ID. Verifique se o GUID listado com a Identidade Gerenciada do Usuário é ObjectId ou AppId da Entidade de Serviço. Quando ele é a ObjectId:

  • Defina-a usando o portal
  • Reimplante com sua solução preferida usando a AppId.

Cenário: implantar relatórios no Power BI

Problema: a Instância Gerenciada de SQL não é acessível

Causa: ocorre se o ponto de extremidade público não estiver habilitado. O Power BI não poderá acessar a Instância Gerenciada de SQL.

Resolução: verifique as permissões do usuário na Instância Gerenciada de SQL e forneça as permissões necessárias.

Problema: não é possível atualizar as credenciais do conjunto de dados

Causa: ocorre se o usuário não tiver permissões apropriadas na Instância Gerenciada de SQL.

Resolução: verifique as permissões do usuário na Instância Gerenciada de SQL e forneça as permissões necessárias.

Problema: o relatório não pode ser atualizado

Causa: ocorre devido ao grande tamanho dos dados. O relatório pode não ser atualizado.

Resolução: se o workspace do Power BI estiver na camada pro, altere-o para camada premium ou altere a capacidade do workspace.

Cenário: Escala manual para cima/para baixo

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados pela VNet

Causa: problema de rede.

Resolução: certifique-se de que a Instância Gerenciada SCOM tem acesso à Internet de saída e o NSG/Firewall está configurado corretamente para permitir o acesso aos pontos de extremidade necessários, conforme descrito em requisitos de firewall.

Problema: cota excedida

Causa: ocorre se não houver núcleos disponíveis para dimensionamento.

Resolução: aumente o número de núcleos na assinatura.

Verifique a seção de cota no portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: erro de provisionamento de extensão

Causa: esse erro pode ocorrer durante o provisionamento da extensão do System Center Operations Manager ou da instalação do System Center Operations Manager.

Resolução: verifique o solução de problemas geral, tente identificar o problema e resolvê-lo adequadamente.

Problema: conflito

Causa: ocorre se a aplicação de patch ou dimensionamento estiver em andamento. Uma nova operação não pode ser disparada.

Resolução: aguarde a conclusão do processo em andamento e tente novamente.

Cenário: aplicação de patch

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados pela VNet

Causa: problema de rede.

Resolução: certifique-se de que a Instância Gerenciada SCOM tem acesso à Internet de saída e o NSG/Firewall está configurado corretamente para permitir o acesso aos pontos de extremidade necessários, conforme descrito em requisitos de firewall.

Problema: a notificação está paralisada no Buscar atualizações mesmo que a operação de atualização esteja concluída

Causa: problema de desenvolvimento/problema de rede.

Resolução: tente atualizar para atualizações. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: o estado de atualização não é refletido corretamente no cartão

Causa: problema de desenvolvimento/problema de rede.

Resolução: tente atualizar para atualizações. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: inconsistência nos controles dentro do cartão

Causa: problema de consistência. Por exemplo, o botão de atualização está habilitado mesmo que o título do cartão seja lido SCOM esteja atualizado.

Resolução: tente atualizar. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: a mensagem de aviso é exibida para atualizações

Causa: ocorre devido a qualquer um dos seguintes motivos:

  1. A nova atualização está disponível e o usuário não disparou a instância de atualização; ou
  2. Falha na última atualização e o usuário não disparou outra instância de atualização.

Resolução: disparar uma instância de atualização.

Problema: a atualização falha após várias tentativas

Resolução: para resolver, entre em contato com o suporte da Microsoft.

Problema: a atualização falha e a reversão não deixa um estado inconsistente em que o número de VMs na instância de Conjuntos de Dimensionamento de Máquinas Virtuais foi modificado

Resolução: vá para o console do System Center Operations Manager e remova nós inconsistentes.

Problema: a atualização falha, mas a atualização do banco de dados é bem-sucedida

Causa: ocorre devido à atualização com falha após a atualização bem-sucedida do banco de dados.

Resolução: tente novamente mais tarde.

Problema: após a atualização bem-sucedida, o console do System Center Operations Manager não está funcionando corretamente na instância

Causa: ocorre se o System Center Operations Manager não estiver instalado corretamente ou algum processo puder ficar travado.

Resolução: tente reiniciar a instância. Se o problema persistir, contate o Suporte da Microsoft.

Problema: a atualização está levando mais de 3 horas e falha eventualmente

Causa: ocorre quando a atualização leva mais de 3 horas.

Resolução: contate o suporte da Microsoft.

Problema: algum problema intermitente durante a atualização

Causa: ocorre se a malha de serviço ou RP falhar ou reiniciar.

Resolução: reinicie a atualização.

Problema: o dimensionamento e a aplicação de patch disparados simultaneamente e, em seguida, falha

Causa: ocorre se solicitações de dimensionamento e aplicação de patch forem enviadas e aceitas ao mesmo tempo.

Resolução: caso você tenha disparado uma operação de dimensionamento, aguarde até que a operação seja concluída antes de tentar atualizar a operação.

Problema: a extensão leva mais tempo para ser atualizada e falha

Causa: ocorre se a Instância Gerenciada de SQL e a Instância Gerenciada de SCOM estiverem em regiões diferentes devido à qual a extensão leva mais tempo para ser atualizada e, eventualmente, falhar.

Resolução: tenha a Instância Gerenciada de SQL e a Instância Gerenciada de SCOM na mesma região.

Problema: após a aplicação de patch, os dados do usuário no banco de dados são alterados ou não mantidos corretamente

Causa: ocorre se a atualização não foi feita corretamente.

Resolução: reinicie a atualização.

Problema: a solicitação de aplicação de patches falha

Causa: ocorre devido ao problema do portal ou do ARM.

Resolução: aguarde algum tempo e tente novamente. Se o problema existir mesmo após a correção do problema de portal/ARM, entre em contato com o suporte da Microsoft.

Problema: a operação de aplicação de patch ou dimensionamento já está em andamento, tente novamente após algum tempo.

Causa: ocorre se uma operação de aplicação de patch ou dimensionamento já estiver em andamento.

Resolução: aguarde a conclusão da operação existente e tente depois de algum tempo.

Problema: Servidores de Gerenciamento Obsoletos visíveis no console

Causa: ocorre se uma operação de aplicação de patch ou dimensionamento deixou um estado inconsistente após a conclusão.

Resolução: os Conjuntos de Dimensionamento de Máquinas Virtuais do Microsoft Azure são usados para provisionar os servidores de gerenciamento para Instâncias Gerenciadas de SCOM. Para remover o servidor de gerenciamento obsoleto do sistema, siga estas etapas:

  1. Acesse os Conjuntos de Dimensionamento de Máquinas Virtuais do Azure e faça logon em um dos servidores de gerenciamento da Instância Gerenciada de SCOM.

  2. Inicie o PowerShell no modo administrativo e navegue até o diretório a seguir.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Observação

    Para localizar a versão, acesse C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows e examine todas as versões disponíveis e selecione a mais recente.

  3. Execute a consulta a seguir:

    .\RemoveStaleManagementServers.ps1 
    

    O script é interativo e solicita o FQDN do servidor obsoleto.

  4. Forneça o FQDN preciso do servidor de gerenciamento obsoleto que você deseja remover.

    Por exemplo, FQDN: SCOMMI2000001.contoso.com.