Compartilhar via


Diretrizes para solucionar problemas de falha de inicialização do serviço de cluster

Lista de verificação de solução de problemas

Verificar as portas usadas pelo Serviço de cluster

Verifique se as seguintes portas estão abertas para o tráfego de cluster em qualquer firewall:

  • Porta 135: mapeador de ponto de extremidade de chamada de procedimento remoto (RPC) ou modelo de objeto de componente distribuído (DCOM).

  • Porta 135: mapeador de ponto de extremidade RPC sobre protocolo de datagrama do usuário (UDP).

  • Porta 3343: driver de rede de cluster.

  • Porta 445: bloco de mensagens do servidor (SMB).

  • Porta 139: serviço de sessão NetBIOS.

  • Portas no intervalo de 5000 a 5099: se a ID do evento 1721 for registrada quando você se conectar a um cluster como administrador de cluster, tente abrir as portas nesse intervalo (ou outras portas) para o tráfego RPC. As portas suportam comunicação por meio de RPC, a menos que você apenas digite um caractere de ponto (.).

    Esse problema pode ocorrer porque o serviço de cluster usa pelo menos 100 portas para comunicação RPC. O número de portas disponíveis para o serviço de cluster pode se tornar muito pequeno quando outros serviços usam algumas das portas necessárias. Esses serviços podem incluir o serviço DNS do Windows, o WINS (Serviço de Cadastramento na Internet do Windows) ou o serviço Microsoft SQL Server.

  • Portas no intervalo de 8011 a 8031: Se os firewalls separarem os nós do cluster, as portas no intervalo de 8011 a 8031 deverão estar abertas ao tráfego RPC entre nós. Caso contrário, os erros no log do cluster indicam que um nó patrocinador não está disponível. Esses erros ocorrem porque não há portas suficientes disponíveis para comunicação RPC entre um nó que tenta ingressar no cluster e um nó que pode patrocinar esse nó.

Para obter mais informações sobre como configurar uma rede e portas de rede para um cluster, consulte os seguintes artigos:

Depois de alterar as configurações de porta, tente colocar o nó online novamente antes de continuar.

Executar a ferramenta de validação de clusters

  1. Abra o snap-in do Gerenciador de Cluster de Failover (CluAdmin.msc).

  2. Selecione Gerenciador de Cluster de Failover na coluna superior esquerda.

  3. Selecione Validar configuração.

  4. Digite o nome de cada nó no cluster e selecione Adicionar após cada um.

  5. Quando todos os nós tiverem sido adicionados à lista Servidores selecionados: , selecione Avançar.

  6. Selecione Executar todos os testes (recomendado)>Próximo>Próximo.

  7. Permita que o teste termine. Depois de concluído, selecione Exibir relatório.

  8. Revise todos os resultados de testes rotulados como Falha ou Aviso. Essas informações podem ajudar a fornecer etapas acionáveis para corrigir o problema.

  9. Para obter um arquivo para download, navegue até a pasta C:\Windows\Cluster\Reports e abra o Relatório de Validação (. MHT).

    Observação

    No Windows Server 2016 e versões posteriores, é um arquivo .HTM .

Verificar as políticas de segurança que podem afetar o nó do cluster

No Editor de Objeto de Política de Grupo, esses objetos de política estão localizados em Configuração do Computador\Configurações do Windows\Configurações de Segurança\Políticas Locais\Atribuição de Direitos de Usuário.

Observação

Para acessar as configurações da política de segurança local, selecione Iniciar, digite política de segurança local e selecione Política de Segurança Local.

Depois de alterar as configurações de política, tente colocar o nó online novamente antes de continuar.

Desabilitar temporariamente os firewalls

Desabilite o firewall entre o nó e o restante do cluster e tente colocar o nó online novamente. Se o nó ainda não ficar on-line, o firewall pode ser a causa.

Importante

Não deixe essa alteração em vigor depois de concluir a solução de problemas. Depois de usar essa alteração para teste, retorne essas configurações para a configuração original.

Verificar o hardware e o software de rede em busca de problemas

  • Verifique o log de eventos do sistema em busca de erros de hardware ou software relacionados aos adaptadores de rede neste nó.

  • Verifique o adaptador de rede, os cabos e a configuração de rede para as redes que conectam os nós.

  • Se você estiver agrupando os adaptadores de rede, verifique se a configuração de agrupamento está correta.

  • Verifique os hubs, os comutadores ou as pontes nas redes que conectam os nós.

Revisar os arquivos de log

Para identificar a origem do problema, revise as informações de log de várias fontes. Por exemplo:

  • No Visualizador de Eventos, navegue até Logs de Aplicativos e Serviços\Microsoft\Windows\FailoverClustering-Client\Diagnostic e examine os logs de Rastreamento de Depuração da API de Cluster.

  • Gere um novo log de cluster para o nó. No servidor que está executando o nó afetado, abra um prompt do PowerShell com privilégios elevados e execute o seguinte cmdlet:

    Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Para gerar um rastreamento mais detalhado, siga estas etapas:

  1. Em um prompt do PowerShell com privilégios elevados, execute o seguinte cmdlet para iniciar o rastreamento:

    logman create trace "base_cluster" -ow -o c:\base_cluster.etl -p "Microsoft-Windows-FailoverClustering-Client" 0xffffffffffffffff 0xff -nb 16 16 -bs 1024 -mode Circular -f bincirc -max 4096 -ets

  2. Reproduza o problema.

  3. Para interromper o rastreamento, execute o seguinte cmdlet:

    Logman stop base_cluster.etl -ets

  4. Para converter o rastreamento, execute o seguinte cmdlet:

    Netsh trace convert base_cluster.etl

  5. Para gerar um log de cluster a partir dos dados, execute o seguinte cmdlet:

    Get-ClusterLog -Node 'Local Node Name' -Destination c:\temp -UseLocalTime

Para obter mais informações sobre rastreamento e outros problemas a serem observados, consulte Como solucionar problemas de falhas de criação de cluster.