Os nós de computação HPC não são mostrados ou estão em estado de erro
Este artigo fornece uma solução para um problema em que os nós de computação não são mostrados ou estão em um estado de erro quando você implanta um cluster de HPC (computação de alto desempenho) no Azure.
Sintomas
Quando você implanta um cluster HPC no Azure, a implantação é bem-sucedida, mas os nós de computação não são mostrados ou estão em um estado de erro. Você vê erros relacionados a certificado e rede nos logs de serviço HpcNodeManager no nó de computação.
Aqui está um exemplo de erro de rede:
System.Net.Sockets.SocketException: uma tentativa de conexão falhou porque a parte conectada não respondeu corretamente após um período de tempo ou a conexão estabelecida falhou porque o host conectado não respondeu x.x.x.x:xxx
Motivo
Esse problema ocorre devido a problemas de configuração de rede ou algum tipo de incompatibilidade de certificado.
Resolução
Verifique os erros de rede e certificado nos logs de serviço HpcNodeManager no nó de computação.
Corrija as incompatibilidades de certificado, se houver. Para obter mais informações, consulte Gerenciar certificados para o cluster HPC Pack 2019.
Para resolver problemas de rede com o erro acima, configure as regras do Grupo de Segurança de Rede e as regras de firewall. Para obter mais informações, consulte a seção "Configurar o Grupo de Segurança de Rede para a rede virtual do Azure" em Intermitência para a VM de IaaS do Azure de um cluster do HPC Pack.
Entre em contato conosco para obter ajuda
Se você tiver dúvidas ou precisar de ajuda, crie uma solicitação de suporte ou peça ajuda à comunidade de suporte do Azure. Você também pode enviar comentários sobre o produto para a comunidade de comentários do Azure.