Partager via


Les nœuds de calcul HPC ne sont pas affichés ou sont dans un état d’erreur

Cet article fournit une solution pour un problème dans lequel les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur lorsque vous déployez un cluster HPC (High-Performance Computing) sur Azure.

Symptômes

Lorsque vous déployez un cluster HPC sur Azure, le déploiement réussit, mais les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur. Vous voyez des erreurs liées au certificat et au réseau dans les journaux du service HpcNodeManager sur le nœud de calcul.

Voici un exemple d’erreur réseau :

System.Net.Sockets.SocketException : une tentative de connexion a échoué, car la partie connectée n’a pas répondu correctement après une période donnée, ou la connexion établie a échoué, car l’hôte connecté n’a pas pu répondre à x.x.x.x :xxx

Cause

Ce problème se produit en raison de problèmes de configuration réseau ou d’une incompatibilité de certificat.

Résolution

Vérifiez les erreurs réseau et de certificat dans les journaux du service HpcNodeManager sur le nœud de calcul.

Corriger les incompatibilités de certificat s’il y en a un. Pour plus d’informations, consultez Gérer les certificats pour le cluster HPC Pack 2019.

Pour résoudre les problèmes réseau liés à l’erreur ci-dessus, configurez les règles de groupe de sécurité réseau et les règles de pare-feu. Pour plus d’informations, consultez la section « Configurer le groupe de sécurité réseau pour le réseau virtuel Azure » dans Burst to Azure IaaS VM from an HPC Pack Cluster.

Contactez-nous pour obtenir de l’aide

Pour toute demande ou assistance, créez une demande de support ou posez une question au support de la communauté Azure. Vous pouvez également soumettre des commentaires sur les produits à la communauté de commentaires Azure.