Węzły obliczeniowe HPC nie są wyświetlane lub są w stanie błędu
Ten artykuł zawiera rozwiązanie problemu, w którym węzły obliczeniowe nie są wyświetlane lub są w stanie błędu podczas wdrażania klastra obliczeń o wysokiej wydajności (HPC) na platformie Azure.
Symptomy
Podczas wdrażania klastra HPC na platformie Azure wdrożenie powiedzie się, ale węzły obliczeniowe nie są wyświetlane lub są w stanie błędu. W dziennikach usługi HpcNodeManager w węźle obliczeniowym są wyświetlane błędy związane z certyfikatem i siecią.
Oto przykład błędu sieci:
System.Net.Sockets.SocketException: Próba połączenia nie powiodła się, ponieważ połączona strona nie odpowiedziała prawidłowo po upływie określonego czasu lub nawiązano połączenie nie powiodło się, ponieważ połączony host nie odpowiedział na x.x.x.x:xxx
Przyczyna
Ten problem występuje z powodu problemów z konfiguracją sieci lub niezgodności certyfikatu typu.
Rozwiązanie
Sprawdź błędy sieci i certyfikatów w dziennikach usługi HpcNodeManager w węźle obliczeniowym.
Popraw niezgodność certyfikatów, jeśli istnieją. Aby uzyskać więcej informacji, zobacz Zarządzanie certyfikatami dla klastra HPC Pack 2019.
Aby rozwiązać problemy z siecią z powyższym błędem, skonfiguruj reguły sieciowej grupy zabezpieczeń i reguły zapory. Aby uzyskać więcej informacji, zobacz sekcję "Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure" w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure) w artykule Burst to Azure IaaS VM from an HPC Pack Cluster (Skalowanie do maszyny wirtualnej IaaS platformy Azure z klastra HPC Pack).
Skontaktuj się z nami, aby uzyskać pomoc
Jeśli masz pytania lub potrzebujesz pomocy, utwórz wniosek o pomoc techniczną lub zadaj pytanie w społeczności wsparcia dla platformy Azure. Możesz również przesłać opinię o produkcie do społeczności opinii na temat platformy Azure.