Udostępnij za pośrednictwem


Węzły obliczeniowe HPC nie są wyświetlane lub są w stanie błędu

Ten artykuł zawiera rozwiązanie problemu, w którym węzły obliczeniowe nie są wyświetlane lub są w stanie błędu podczas wdrażania klastra obliczeń o wysokiej wydajności (HPC) na platformie Azure.

Symptomy

Podczas wdrażania klastra HPC na platformie Azure wdrożenie powiedzie się, ale węzły obliczeniowe nie są wyświetlane lub są w stanie błędu. W dziennikach usługi HpcNodeManager w węźle obliczeniowym są wyświetlane błędy związane z certyfikatem i siecią.

Oto przykład błędu sieci:

System.Net.Sockets.SocketException: Próba połączenia nie powiodła się, ponieważ połączona strona nie odpowiedziała prawidłowo po upływie określonego czasu lub nawiązano połączenie nie powiodło się, ponieważ połączony host nie odpowiedział na x.x.x.x:xxx

Przyczyna

Ten problem występuje z powodu problemów z konfiguracją sieci lub niezgodności certyfikatu typu.

Rozwiązanie

Sprawdź błędy sieci i certyfikatów w dziennikach usługi HpcNodeManager w węźle obliczeniowym.

Popraw niezgodność certyfikatów, jeśli istnieją. Aby uzyskać więcej informacji, zobacz Zarządzanie certyfikatami dla klastra HPC Pack 2019.

Aby rozwiązać problemy z siecią z powyższym błędem, skonfiguruj reguły sieciowej grupy zabezpieczeń i reguły zapory. Aby uzyskać więcej informacji, zobacz sekcję "Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure" w temacie Burst to Azure IaaS VM from an HPC Pack Cluster (Konfigurowanie sieciowej grupy zabezpieczeń dla sieci wirtualnej platformy Azure) w artykule Burst to Azure IaaS VM from an HPC Pack Cluster (Skalowanie do maszyny wirtualnej IaaS platformy Azure z klastra HPC Pack).

Skontaktuj się z nami, aby uzyskać pomoc

Jeśli masz pytania lub potrzebujesz pomocy, utwórz wniosek o pomoc techniczną lub zadaj pytanie w społeczności wsparcia dla platformy Azure. Możesz również przesłać opinię o produkcie do społeczności opinii na temat platformy Azure.