Compartilhar via


Os nós de computação HPC não são mostrados ou estão em estado de erro

Este artigo fornece uma solução para um problema em que os nós de computação não são mostrados ou estão em um estado de erro quando você implanta um cluster de HPC (computação de alto desempenho) no Azure.

Sintomas

Quando você implanta um cluster HPC no Azure, a implantação é bem-sucedida, mas os nós de computação não são mostrados ou estão em um estado de erro. Você vê erros relacionados a certificado e rede nos logs de serviço HpcNodeManager no nó de computação.

Aqui está um exemplo de erro de rede:

System.Net.Sockets.SocketException: uma tentativa de conexão falhou porque a parte conectada não respondeu corretamente após um período de tempo ou a conexão estabelecida falhou porque o host conectado não respondeu x.x.x.x:xxx

Motivo

Esse problema ocorre devido a problemas de configuração de rede ou algum tipo de incompatibilidade de certificado.

Resolução

Verifique os erros de rede e certificado nos logs de serviço HpcNodeManager no nó de computação.

Corrija as incompatibilidades de certificado, se houver. Para obter mais informações, consulte Gerenciar certificados para o cluster HPC Pack 2019.

Para resolver problemas de rede com o erro acima, configure as regras do Grupo de Segurança de Rede e as regras de firewall. Para obter mais informações, consulte a seção "Configurar o Grupo de Segurança de Rede para a rede virtual do Azure" em Intermitência para a VM de IaaS do Azure de um cluster do HPC Pack.

Entre em contato conosco para obter ajuda

Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.