Noções básicas sobre testes de diagnóstico
O Microsoft HPC Pack fornece um conjunto de testes de diagnóstico comumente usados. Você pode usar esses testes para ajudar a verificar a implantação, solucionar problemas de falhas e detectar degradação de desempenho. Este tópico descreve os testes System incluídos por padrão quando você instala o HPC Pack. Para obter informações sobre os HPC Services para testes de do Excel, testes recém-disponíveis e criação de diagnósticos personalizados, consulte recursos de diagnóstico online.
Os testes de diagnóstico do System são agrupados conceitualmente por conjunto. As seções a seguir neste tópico descrevem os testes em cada pacote e, se aplicável, os parâmetros configuráveis para os testes:
do Validador de Ambiente de Implantação (testes adicionados no HPC Pack 2008 R2 Service Pack 1)
de Status da Rede
o Windows Azure (pacote adicionado ao HPC Pack 2008 R2 com Service Pack 2)
Validador de Ambiente de Implantação
Os testes neste pacote podem ajudá-lo a encontrar problemas comuns que podem afetar a implantação de nós bare-metal. Para obter mais informações, consulte Validar seu ambiente antes de implantar nós.
Nota
Para um nó principal configurado como um cluster de failover, os testes do validador de ambiente de implantação verificam apenas o nó principal ativo. Para verificação adicional, talvez você queira fazer failover e executar os testes no outro nó principal. Normalmente, nós de cabeçalho em um cluster de failover com configurações semelhantes e problemas diferentes entre os dois nós principais são incomuns, mas pode ser bom executar o teste após uma recuperação (no nó principal recém-recuperado/restaurado após uma falha fatal).
Diagnóstico | Descrição |
---|---|
Implantação: teste de DHCP | Verifica a disponibilidade do servidor DHCP para todas as redes. |
Implantação: Teste de DNS | Verifica a disponibilidade do servidor DNS para todas as redes e relata os endereços IP do servidor DNS. |
Implantação: Teste de credenciais | Verifica se as credenciais de instalação são as de um usuário HPC válido. Para obter mais informações, consulte fornecer credenciais de instalação. |
Implantação: Teste de conectividade do Active Directory | Verifica a conectividade com o controlador de domínio e relata o tempo de resposta. |
Implantação: Teste IPsec | Verifica se a segurança do Protocolo de Internet (IPsec) está habilitada na rede Enterprise. Se o IPsec for imposto em seu domínio por meio da Política de Grupo, você poderá enfrentar problemas durante a implantação. Por exemplo, o IPsec pode impedir que os nós de computação falem com o nó principal bloqueando as portas. |
Implantação: Teste dos Serviços de Implantação do Windows | Verifica se o serviço de transporte de implantação do Windows está ativado e se o Servidor de Implantação não está instalado. Os Serviços de Implantação do Windows permitem a instalação remota do Windows em computadores habilitados para PXE. O HPC Pack usa apenas o serviço de função servidor de transporte na função Serviços de Implantação do Windows. O serviço de função servidor de implantação não precisa ser instalado. |
Implantação: Imagem do Windows e teste de compartilhamento de instalação | Verifica se a imagem de instalação em cada modelo de nó e a imagem do Windows PE (Ambiente de Pré-Instalação do Windows) usada para implantação não estão ausentes, corrompidas ou bloqueadas por outro processo e que o tamanho da imagem do Windows PE não excede 300 MB. Verifica se a pasta compartilhada usada para instalação existe e tem as permissões corretas. Consulte também Noções básicas sobre modelos de nó. O Windows PE é usado para preparar um computador para instalação do Windows, copiar imagens de disco de um servidor de arquivos de rede, iniciar a Instalação do Windows e capturar a imagem de um nó. |
Implantação: teste NAT | Verifica se a NAT (Conversão de Endereços de Rede) está configurada corretamente no nó principal, para que os nós de computação possam se comunicar com a rede Enterprise em algumas topologias. |
Implantação: Teste de firewall |
Teste adicionado no HPC Pack 2008 R2 Service Pack 1. Verifica se o firewall está desativado para os adaptadores de rede nas redes de cluster privado e de aplicativo (ou seja, que esses adaptadores de rede são excluídos do Firewall do Windows). Ele também verifica se as regras de firewall de entrada e saída necessárias no nó principal estão configuradas corretamente. Para obter mais informações, consulte a seção de configuração do Firewall do Windows no de Rede de Cluster HPC. |
Implantação: Portas abertas teste |
Teste adicionado no HPC Pack 2008 R2 com Service Pack 1. Verifica se as seguintes portas TCP estão abertas no Firewall do Windows: - 1856 - 6729 - 6730 - 9094 - 9095 - 9096 - 9794 - 9892 - 9893 - 9894 Para obter informações sobre as portas exigidas pelo HPC Pack para comunicação entre os serviços de cluster no nó principal e os outros nós no cluster, consulte a seção de configuração do Firewall do Windows no de Rede de Cluster HPC. |
Implantação: Teste de ordem de associação |
Teste adicionado no HPC Pack 2008 R2 com Service Pack 1. Verifica se a rede enterprise é definida como a primeira na ordem de associação nos gateways de rede padrão. Se a rede privada estiver listada antes da rede Enterprise, isso poderá causar problemas de comunicação com o controlador de domínio do Active Directory na rede Enterprise. |
Implantação: teste de recursos de rede virtual de HA |
Teste adicionado no HPC Pack 2008 R2 com Service Pack 1. Se o nó principal estiver configurado em um cluster de failover para alta disponibilidade, verifique se os recursos de rede virtual para o cluster de failover estão configurados corretamente. Depois que o nó principal é configurado em um cluster de failover, porque o cluster de failover não está vinculado a um único servidor físico, ele não pode ter o nome e o endereço IP de um servidor físico. O cluster de failover deve ter um nome de nó de cabeçalho virtual e um endereço IP virtual correspondente diferente dos nomes físicos e endereços IP dos dois nós principais no cluster de failover. Isso permite que as comunicações nas redes Enterprise e Privada entrem em contato com o nó principal que está atualmente ativo a qualquer momento pelo nome virtual e pelo endereço IP, garantindo que a comunicação não será interrompida se o nó principal ativo falhar e a funcionalidade mudar para o nó principal passivo. Para obter mais informações, consulte Configurando o Microsoft HPC Pack para alta disponibilidade do nó principal. |
Desempenho do MPI
Os testes de ping-pong da MPI (Interface de Passagem de Mensagem) medem a latência de rede e a taxa de transferência entre nós no cluster enviando pacotes de dados para frente e para trás entre nós emparelhados repetidamente. A latência é a média da metade do tempo que leva para um pacote fazer uma viagem de ida e volta entre um par de nós, em microssegundos. A taxa de transferência é a taxa média de transferência de dados entre um par de nós, em MB/segundo. Ao executar os testes de ping-pong de MPI, você pode especificar o modo de execução e a rede a ser usada.
Importante
Para obter resultados precisos com os testes de ping-pong de MPI, execute os testes no modo Serial (se disponível) e verifique se os nós não estão executando trabalhos. Se os nós estiverem executando trabalhos, os testes não retornarão medidas precisas de latência e taxa de transferência.
O parâmetro de modo de execução tem os seguintes valores:
Anel: em um teste de anel (também conhecido como um teste vizinho mais próximo), os nós enviam pacotes um para o outro um par por vez em um padrão de anel. Enquanto um par de nós executa o teste, todos os outros nós permanecem ociosos. O primeiro nó emparelha com seu vizinho imediato. Quando o teste no primeiro par é concluído, o próximo nó emparelha de forma semelhante com um vizinho. Esse emparelhamento sequencial e o teste continuam até que o teste cubra todos os nós no cluster HPC e cada nó tenha emparelhado com dois vizinhos, um em cada direção ao redor do anel.
Você pode usar o modo Ring para obter uma indicação razoável do desempenho de um cluster HPC em um período mínimo de tempo. O teste de anel leva menos tempo do que um teste em estilo de torneio ou serial porque cada nó é testado com apenas dois nós vizinhos em vez de com todos os nós no cluster.
Serial: o modo serial executa o teste de ping-pong de MPI em um par de nós de cada vez. Enquanto um par de nós executa o teste, todos os outros nós permanecem ociosos. Quando um par de nós conclui o teste, o teste é executado para outro par de nós e esse teste de pares individuais prossegue em série até que todos os pares possíveis de nós sejam testados.
Você pode usar modo de serial para testar completamente todos os links de rede individuais entre nós quando o cluster HPC tiver um pequeno número de nós. Esse modo fornece a medida mais precisa de latência ou taxa de transferência. Como o teste serial executa o teste de ping-pong de MPI em todos os pares possíveis de nós um par de cada vez, o teste pode levar muito tempo para um grande número de nós.
Torneio: o modo torneio executa o teste de ping-pong da MPI em várias rodadas, semelhante a um torneio. Em cada rodada, todos os nós no par de cluster HPC são desativados. Os dois nós em cada par enviam pacotes um para o outro, com todos os pares trocando pacotes em paralelo. Quando uma rodada é concluída, outra rodada começa, usando um conjunto diferente de pares de nós que foi usado em rodadas anteriores. As rodadas continuam até que todos os pares de nós possíveis tenham sido testados. Os testes nesse modo completam o mais rápido e os comutadores de rede são mais carregados.
Você pode usar modo de do Torneio para testar a infraestrutura da rede especificada e como ela é executada quando carregada. A latência e a taxa de transferência medidas são as de um cluster carregado e, portanto, podem não ser comparadas favoravelmente com as especificações do fabricante para o hardware de rede.
Nota
Você pode executar os testes com argumentos adicionais e obter saída adicional usando o comando
Diagnóstico | Descrição |
---|---|
Ping Pong de MPI: Latência | Esse teste mede a largura de banda e a latência da comunicação nó a nó. Como esse é um teste de desempenho, para obter resultados precisos, execute este teste em nós offline e não executando outros trabalhos. parâmetros : Você pode especificar a rede a ser usada para o teste e o modo de execução. Por padrão, esse teste é executado no modo do Torneio |
MPI Ping Pong: Taxa de Transferência | Mede a taxa de transferência de rede entre nós adjacentes no cluster. parâmetros de : Você pode especificar a rede a ser usada para o teste e o modo de execução ( Serial ou Tournament). Por padrão, esse teste é executado no modo Serial. |
MPI Ping Pong: taxa de transferência simples | Mede a taxa de transferência de rede entre nós adjacentes no cluster. parâmetros : Você pode especificar a rede a ser usada para o teste. Mede a taxa de transferência somente entre pares de nós adjacentes no cluster usando modo de anel. Isso fornece uma verificação razoável da conectividade em toda a rede especificada. Para obter medidas de taxa de transferência mais precisas, execute o teste ping Pong de MPI: taxa de transferência teste. |
Status da Rede
Os testes neste pacote podem ajudá-lo a verificar a configuração da rede de cluster. Não há parâmetros que você possa configurar para esses testes.
Diagnóstico | Descrição |
---|---|
Relatório de configuração de firewall | Relata o status do firewall (habilitado ou desabilitado) para os nós selecionados. Esse teste também relata os aplicativos ou serviços que têm permissão de acesso por meio do firewall (as exceções de firewall), incluindo qual número de porta eles estão usando. Consulte também Noções básicas sobre a configuração de firewall para redes HPC. |
Relatório de Configuração de Rede | Relatórios sobre a configuração dos adaptadores de rede para cada nó selecionado. |
Solução de problemas de rede
Os testes neste pacote podem ajudá-lo a verificar a conectividade de rede para nós de cluster.
Diagnóstico | Descrição |
---|---|
Teste DNS | Verifica a resolução de nomes do DNS (Sistema de Nomes de Domínio) entre os nós selecionados. |
Teste de conectividade de domínio | Verifica a conectividade entre os nós selecionados e cada controlador de domínio. |
Teste de ping | Verifica a conectividade de rede entre os nós selecionados executando um teste de ping entre cada nó e todos os outros nós no grupo selecionado. parâmetros : Você pode especificar a rede a ser usada para o teste e o número de pings por nó. |
Nota
O Pacote de Ferramentas do HPC Pack inclui o Relatório de Solução de Problemas de Rede, um teste de diagnóstico adicional que coleta e analisa informações de rede em seu cluster baseado em HPC Pack para ajudar a solucionar problemas de rede. Se você tiver uma rede InfiniBand, o relatório também inclui o status e os recursos dos cartões HCA (Adaptador de Canal de Host) nessa rede. Para obter mais informações, consulte Instalar e usar o teste de diagnóstico de relatório de solução de problemas de rede.
Serviços
Os testes e relatórios neste pacote podem ajudá-lo a verificar se os serviços HPC necessários estão em execução nos nós selecionados e solucionar problemas de erros de serviço.
Diagnóstico | Descrição |
---|---|
Relatório de Configuração de Serviço | Relata todos os serviços em execução instalados nos nós selecionados e na configuração de inicialização. |
Relatório de Status do Serviço | Relatórios sobre eventos HPC no log de eventos para os nós selecionados. parâmetros : Você pode especificar a contagem de Hora para indicar o quão distante para verificar o log de eventos (entre 1 e 50 horas atrás). Você também pode limitar o número de eventos a relatar definindo o parâmetro de contagem de logs |
Teste de execução de serviços | Verifica se os serviços de HPC estão em execução nos nós selecionados. Os serviços esperados são determinados pela função do nó de destino (nó principal, nó de computação ou nó do agente do WCF). Esse teste pode relatar o status dos serviços opcionais, se eles estiverem presentes, mas ele só valida em relação aos serviços necessários. |
SOA
O teste de carregamento do serviço SOA verifica se as DLLs para o serviço especificado podem ser carregadas nos nós especificados e que quaisquer dependências detectadas para a DLL estão presentes nos nós. Por padrão, esse teste usa o serviço ccpEchoSvc
Para verificar se um determinado serviço pode ser carregado, você pode especificar o nome do serviço no parâmetro de teste. Quando você executa ode teste de carregamento do serviço SOA
Configuração do sistema
Os relatórios neste pacote fornecem informações sobre a configuração do aplicativo e as atualizações de software nos nós selecionados.
Diagnóstico | Descrição |
---|---|
Relatório do Active Power Scheme |
Teste adicionado no HPC Pack 2012. Relata o esquema de energia ativo (plano) e lista todos os esquemas de energia existentes configurados no sistema operacional nos nós selecionados. |
Relatório de Configuração de Aplicativo | Relata os aplicativos, incluindo os números de versão, instalados nos nós selecionados. Os resultados incluem uma tabela que lista todos os aplicativos instalados e uma contagem dos nós que têm esse aplicativo instalado. Você também pode exibir os resultados por nó. |
Atualizações de software disponíveis para relatório de nó | Relata as atualizações de software disponíveis para os nós selecionados. O teste relata as atualizações identificadas como críticas pelo WSUS (Windows Server Update Services) ou pelo Microsoft Update. O diagnóstico se comunica com o cliente do Microsoft Update, que filtra as atualizações para que somente aquelas relevantes para o nó sejam relatadas ao diagnóstico. Esse teste falhará se o proxy winhttp não estiver definido no nó de computação. Execute o comando netsh winhttp show proxy para determinar se os nós têm um servidor proxy definido.Para obter mais informações sobre como aplicar atualizações usando um servidor WSUS corporativo ou usando um modelo de nó, consulte o tópico Práticas Recomendadas no guia passo a passo de atualização de nós . |
Teste de KSP do HPC Soft Card |
Teste adicionado no HPC Pack 2008 R2 com Service Pack 2. Informa se o KSP (provedor de armazenamento de chaves de cartão flexível) do HPC está instalado nos nós de cluster selecionados. Essa configuração habilita a autenticação de cartão reversível ao executar tarefas nos nós. O KSP é uma instalação separada que só é instalada no nó principal e nos nós de computação. Ele não precisa ser instalado nos nós do cliente. O componente KSP é usado para executar o logon do Cartão Inteligente para as tarefas executadas em nós de computação. O KSP é usado apenas em computadores em que as tarefas são executadas. Se o teste falhar: O KSP de cartão flexível do HPC não está instalado neste computador. Para obter informações sobre como instalá-lo para habilitar a autenticação de cartão flexível, consulte as notas de versão do Microsoft HPC Pack. Se o teste for aprovado: O KSP de cartão flexível do HPC será instalado neste computador. |
Atualizações de software ausentes/necessárias do relatório de modelo | Compara as atualizações de software instaladas nos nós selecionados com as atualizações especificadas na tarefa Aplicar Atualizações no modelo de nó. O relatório indica se os nós de computação falharam ao atender ao nível de atualização necessário (Nenhum, Crítico, Todos) ou se não há atualizações específicas, conforme definido no modelo de nó. Se esses relatórios de diagnóstico que exigiram atualizações estiverem ausentes, mantenha os nós indicados offline e execute a ação Manter. Consulte executar tarefas de manutenção em nós. O modelo de nó deve incluir a tarefa Aplicar Atualizações para executar esse teste. Se o modelo de nó não incluir essa tarefa, você poderá executar o Atualizações de Software Disponíveis para Relatório de Nó para ver uma lista de atualizações disponíveis ou adicionar a tarefa ao modelo de nó. Para obter informações sobre como adicionar a tarefa de atualização ao modelo de nó, consulte Adicionar a Tarefa Aplicar Atualizações a um Modelo de Nó. |
Atualizações de software instaladas no relatório de nós | Relata as atualizações instaladas nos nós selecionados. |
Windows Azure
Suite adicionado ao HPC Pack 2008 R2 com o Service Pack 2.
Os testes neste pacote podem ajudá-lo a verificar se você pode implantar e executar trabalhos nos nós do Windows Azure em seu cluster.
Diagnóstico | Descrição |
---|---|
Teste de portas do Firewall do Azure do Windows | Executa um teste simples para verificar a comunicação do nó principal para o Windows Azure por meio de firewalls internos e externos existentes. Esse teste sempre é executado usando as credenciais de teste de diagnóstico padrão. Você pode executar esse teste antes de implantar nós do Windows Azure para ajudar a garantir que qualquer firewall existente esteja configurado para permitir a implantação, o agendador e a comunicação do agente entre o nó principal e o Windows Azure. Este teste verifica a comunicação de saída em portas TCP selecionadas do nó principal para o serviço hpcazureportcheck.cloudapp.net no Windows Azure. O serviço hpcazureportcheck.cloudapp.net é hospedado pela Microsoft para fornecer um ponto de extremidade de comunicação para este teste. Importante: hpcazureportcheck.cloudapp.net não está relacionado a nenhum serviço hospedado do Windows Azure que você usa para suas implantações de nó do Windows Azure. Você não precisa dele para implantar nós do Windows Azure em seu cluster, pois ele só é usado pelo de Teste de Portas de Firewall do Windows Azure. As portas de firewall que o teste verifica são aquelas exigidas pela versão do HPC Pack instalada no nó principal (começando pelo HPC Pack 2008 R2 com SP2). Se você instalou o HPC Pack 2008 R2 com SP2, a comunicação nas seguintes portas TCP será testada: - 80 - 443 - 3389 - 5901 - 5902 - 7998 - 7999 Se você tiver instalado pelo menos o HPC Pack 2008 R2 com SP3, a comunicação nas seguintes portas TCP será testada por padrão: - 443 - 3389 Importante:
Para obter mais informações sobre portas de firewall para Windows Azure, consulte Requirements for Windows Azure Nodes in Microsoft HPC Pack. |
Teste de comunicação do MPI do Windows Azure | Executa um teste simples de ping-pong entre pares de nós do Windows Azure para garantir que a comunicação de MPI esteja funcionando corretamente. Esse teste é executado somente em nós do Windows Azure e em nós na mesma implantação. |
Relatório do Windows Azure | Relata os nomes das instâncias de função para nós do Windows Azure que foram implantados.
Importante: Após a instalação do HPC Pack 2008 R2 SP3, esse teste não fornece mais os nomes das instâncias de função para os nós do Windows Azure. Para solucionar esse problema, você pode executar o seguinte comando em cada nó para o qual deseja ver o nome: Set COMPUTERNAME Você também pode usar um comando clusrun ou criar um novo teste de diagnóstico para executar esse comando em um grupo de nós. |
Teste de conexão dos Serviços do Azure do Windows | Verifica se os serviços em execução no nó principal podem se conectar ao Windows Azure usando as IDs de assinatura e certificados especificados nos modelos de nó do Windows Azure. Esse teste sempre é executado usando as credenciais de teste de diagnóstico padrão. parâmetro : Você pode especificar o modelo de nó a ser usado para o teste. Por padrão, esse teste usa todos os modelos de nó. |
Teste de Rede Virtual do Azure do Windows |
Teste adicionado no HPC Pack 2012. Executa um teste para verificar se os sites da Rede Virtual do Windows Azure configurados em todos os modelos de nó do Windows Azure são válidos. Não há parâmetros que você possa configurar para este teste. |
Referências adicionais
de nós de monitoramento de
Diagnóstico de : do Gerenciador de Cluster do HPC