Поделиться через


Устранение неполадок при установке расширения агента вычислительного узла Linux

В этой статье описывается, как устранить неполадки в сценарии, в котором расширение агента узла узла пакета HPC для Linux не установлено на узле в кластере высокопроизводительных вычислений (HPC).

Контрольный список по устранению неполадок

Чтобы устранить сбой установки расширения Microsoft.HpcPack.LinuxNodeAgent2016U1 на вычислительном узле Linux, изучите файл журнала расширений, а затем установите новый вычислительный узел Linux на инфраструктуре как услуга (IaaS) виртуальной машины (VM).

Шаг 1. Изучение журнала расширений

Файл журнала расширений может помочь определить, почему агент узла не был установлен успешно. Чтобы найти и просмотреть файл журнала расширения, выполните следующие действия.

  1. Откройте консоль PowerShell с правами администратора.

  2. Выполните следующие команды, чтобы включить функцию подключения Secure Shell (SSH) на головном узле:

    dism /Online /Add-Capability /CapabilityName:OpenSSH.Server~~~~0.0.1.0
    Start-Service sshd
    Set-Service -Name sshd -StartupType 'Automatic'
    Set-Service -Name ssh-agent -StartupType 'Automatic'
    Start-Service ssh-agent
    
  3. На головном узле выполните следующую команду, чтобы войти в вычислительный узел Linux:

    ssh <domain-administrator-name>@<private-ip-address-of-linux-compute-node>
    
  4. Введите пароль учетной записи администратора домена.

  5. Выполните следующую команду, чтобы убедиться, что файл журнала расширения существует на узле:

    sudo su ls -la /var/log/azure/Microsoft.HpcPack.LinuxNodeAgent2016U1/extension.log
    
  6. Запустите или откройте предпочитаемое средство просмотра текста или редактор, а затем отобразите содержимое файла журнала расширения.

Шаг 2. Выполнение локального теста для развертывания на виртуальной машине IaaS

Чтобы проверить локальное подключение к виртуальной машине IaaS, выполните следующие действия.

  1. Выполните действия, чтобы создать шаблон узла IaaS Azure. Когда вы достигнете раздела "Указание образа виртуальной машины" мастера создания шаблона, укажите следующие параметры, прежде чем завершить создание шаблона узла.

    Имя поля значение
    Тип образа MarketplaceImage
    Тип ОС. Linux
    Метка изображения Red Hat Enterprise Linux 7.8
  2. Выполните действия, чтобы создать вычислительные узлы IaaS и управлять ими. Когда вы перейдете к разделу "Указать новые узлы " мастера добавления узлов, укажите следующие параметры, прежде чем завершить добавление узла.

    Имя поля значение
    Шаблон узла Имя созданного ранее шаблона узла.
    Количество узлов 1
    Размер узлов виртуальной машины A1 (1 ядро, 1,75 ГБ памяти)
  3. Выполните действия, чтобы создать новое задание в диспетчере кластеров HPC. Когда вы перейдете к разделу выбора ресурсов, выберите LinuxNodes в списке доступных групп узлов, а затем нажмите кнопку "Добавить ", чтобы переместить элемент в список групп выбранных узлов. После отправки нового задания узел Linux будет подготовлен правильно.

Свяжитесь с нами для получения помощи

Если у вас есть вопросы или вам нужна помощь, создайте запрос в службу поддержки или обратитесь за поддержкой сообщества Azure. Вы также можете отправить отзыв о продукте в сообщество отзывов Azure.