Les nœuds de calcul HPC ne sont pas affichés ou sont dans un état d’erreur
Cet article fournit une solution pour un problème dans lequel les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur lorsque vous déployez un cluster HPC (High-Performance Computing) sur Azure.
Symptômes
Lorsque vous déployez un cluster HPC sur Azure, le déploiement réussit, mais les nœuds de calcul ne sont pas affichés ou sont dans un état d’erreur. Vous voyez des erreurs liées au certificat et au réseau dans les journaux du service HpcNodeManager sur le nœud de calcul.
Voici un exemple d’erreur réseau :
System.Net.Sockets.SocketException : une tentative de connexion a échoué, car la partie connectée n’a pas répondu correctement après une période donnée, ou la connexion établie a échoué, car l’hôte connecté n’a pas pu répondre à x.x.x.x :xxx
Cause
Ce problème se produit en raison de problèmes de configuration réseau ou d’une incompatibilité de certificat.
Résolution
Vérifiez les erreurs réseau et de certificat dans les journaux du service HpcNodeManager sur le nœud de calcul.
Corriger les incompatibilités de certificat s’il y en a un. Pour plus d’informations, consultez Gérer les certificats pour le cluster HPC Pack 2019.
Pour résoudre les problèmes réseau liés à l’erreur ci-dessus, configurez les règles de groupe de sécurité réseau et les règles de pare-feu. Pour plus d’informations, consultez la section « Configurer le groupe de sécurité réseau pour le réseau virtuel Azure » dans Burst to Azure IaaS VM from an HPC Pack Cluster.
Contactez-nous pour obtenir de l’aide
Pour toute demande ou assistance, créez une demande de support ou posez une question au support de la communauté Azure. Vous pouvez également soumettre des commentaires sur les produits à la communauté de commentaires Azure.