Los nodos de proceso de HPC no se muestran o están en estado de error
En este artículo se proporciona una solución para un problema en el que los nodos de proceso no se muestran o se encuentran en un estado de error al implementar un clúster de informática de alto rendimiento (HPC) en Azure.
Síntomas
Al implementar un clúster de HPC en Azure, la implementación se realiza correctamente, pero los nodos de proceso no se muestran o se encuentran en un estado de error. Verá errores relacionados con el certificado y la red en los registros del servicio HpcNodeManager en el nodo de proceso.
Este es un ejemplo de error de red:
System.Net.Sockets.SocketException: error en un intento de conexión porque la entidad conectada no respondió correctamente después de un período de tiempo o error en la conexión establecida porque el host conectado no ha podido responder x.x.x.x:xxx
Causa
Este problema se produce debido a problemas de configuración de red o a algún tipo de error de coincidencia de certificado.
Solución
Compruebe los errores de red y de certificado en los registros del servicio HpcNodeManager en el nodo de proceso.
Corregir errores de coincidencia de certificados si hay alguno. Para obtener más información, consulte Manage Certificates for HPC Pack 2019 Cluster (Administrar certificados para clústeres de HPC Pack 2019).
Para resolver problemas de red con el error anterior, configure las reglas del grupo de seguridad de red y las reglas de firewall. Para más información, consulte la sección "Configuración del grupo de seguridad de red para la red virtual de Azure" en Expansión a máquina virtual iaaS de Azure desde un clúster de HPC Pack.
Ponte en contacto con nosotros para obtener ayuda
Si tiene preguntas o necesita ayuda, cree una solicitud de soporte o busque consejo en la comunidad de Azure. También puede enviar comentarios sobre el producto con los comentarios de la comunidad de Azure.