Udostępnij za pośrednictwem


Rozwiązywanie problemów z niepowodzeniem instalacji rozszerzenia agenta węzła obliczeniowego systemu Linux

W tym artykule omówiono sposób rozwiązywania problemów ze scenariuszem, w którym rozszerzenie agenta węzła systemu Linux pakietu HPC Pack dla systemu Linux nie jest pomyślnie instalowane w węźle w klastrze obliczeń o wysokiej wydajności (HPC).

Lista kontrolna rozwiązywania problemów

Aby rozwiązać problemy z nieudaną instalacją rozszerzenia Microsoft.HpcPack.LinuxNodeAgent2016U1 w węźle obliczeniowym systemu Linux, sprawdź plik dziennika rozszerzenia, a następnie zainstaluj nowy węzeł obliczeniowy systemu Linux na maszynie wirtualnej infrastruktury jako usługi (IaaS).

Krok 1. Badanie dziennika rozszerzeń

Plik dziennika rozszerzenia może pomóc w ustaleniu, dlaczego agent węzła nie został pomyślnie zainstalowany. Aby znaleźć i wyświetlić plik dziennika rozszerzenia, wykonaj następujące kroki:

  1. Otwórz administracyjną konsolę programu PowerShell.

  2. Uruchom następujące polecenia, aby włączyć funkcję połączenia protokołu Secure Shell (SSH) w węźle głównym:

    dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0
    Start-Service sshd
    Set-Service -Name sshd -StartupType 'Automatic'
    Set-Service -Name ssh-agent -StartupType 'Automatic'
    Start-Service ssh-agent
    
  3. W węźle głównym uruchom następujące polecenie, aby zalogować się do węzła obliczeniowego systemu Linux:

    ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
    
  4. Wprowadź hasło konta administratora domeny.

  5. Uruchom następujące polecenie, aby sprawdzić, czy plik dziennika rozszerzenia istnieje w węźle:

    sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
    
  6. Uruchom lub otwórz preferowaną przeglądarkę tekstu lub edytor, a następnie wyświetl zawartość pliku dziennika rozszerzenia.

Krok 2. Wykonywanie testu lokalnego w celu skalowania maszyny wirtualnej IaaS

Aby przetestować lokalnie, jak przeprowadzić skalowanie do maszyny wirtualnej IaaS, wykonaj następujące kroki:

  1. Wykonaj kroki tworzenia szablonu węzła IaaS platformy Azure. Po dotarciu do sekcji Określanie obrazu maszyny wirtualnej kreatora tworzenia szablonu określ następujące ustawienia przed zakończeniem tworzenia szablonu węzła.

    Nazwa pola Wartość
    Typ obrazu MarketplaceImage
    Typ systemu operacyjnego Linux
    Etykieta obrazu Red Hat Enterprise Linux 7.8
  2. Wykonaj kroki tworzenia węzłów obliczeniowych IaaS i zarządzania nimi. Po dotarciu do sekcji Określanie nowych węzłów kreatora Dodawanie węzła określ następujące ustawienia przed zakończeniem dodawania węzła.

    Nazwa pola Wartość
    Szablon węzła Nazwa utworzonego wcześniej szablonu węzła.
    Liczba węzłów 1
    Rozmiar maszyny wirtualnej węzłów A1 (1 rdzeń, 1,75 GB pamięci)
  3. Wykonaj kroki, aby utworzyć nowe zadanie w Menedżerze klastra HPC. Po dotarciu do sekcji Wybór zasobów wybierz pozycję LinuxNodes na liście Dostępne grupy węzłów, a następnie wybierz przycisk Dodaj , aby przenieść element do listy Wybrane grupy węzłów. Po przesłaniu nowego zadania węzeł systemu Linux zostanie poprawnie aprowizowany.

Skontaktuj się z nami, aby uzyskać pomoc

Jeśli masz pytania lub potrzebujesz pomocy, utwórz wniosek o pomoc techniczną lub zadaj pytanie w społeczności wsparcia dla platformy Azure. Możesz również przesłać opinię o produkcie do społeczności opinii na temat platformy Azure.