Поделиться через


Заметки о выпуске пакета HPC 2016 с обновлением 2

В этих заметках о выпуске рассматриваются проблемы с поздними критическими проблемами и сведениями для администратора кластера высокопроизводительных вычислений (HPC) о пакете MICROSOFT HPC 2016 с обновлением 2.

Скачивание и установка пакета MICROSOFT HPC 2016 с обновлением 2

Пакет HPC 2016 с обновлением 2 доступен для скачивания из Центра загрузки Майкрософт. Скачайте его на локальный компьютер, который будет выступать в качестве локального головного узла. После скачивания щелкните правой кнопкой мыши ZIP-файл пакета установки и щелкните Свойства, чтобы просмотреть свойства файла. Щелкните разблокируйте, если есть предупреждение системы безопасности, указывающее, что файл может быть заблокирован. Затем извлеките файлы пакета установки в локальную папку и запустите Setup.exe.

Известные проблемы

Установка головного узла может завершиться ошибкой, если пакет установки находится в сетевой папке

Перед установкой последнего головного узла кластера с 3 головными узлами необходимо скопировать пакет установки в локальную папку и запустить Setup.exe. Если вы запускаете Setup.exe из сетевого ресурса для установки последнего головного узла, установка может завершиться ошибкой при установке кластера Microsoft Service Fabric. Эта проблема возникает только для кластера с 3 головными узлами. Для других ролей (включая предварительные требования для нового головного узла) или одного головного кластера можно установить из сетевой папки.

Установка завершается ошибкой из-за перезагрузки компьютера без установки Microsoft .NET Framework 4.6.1 (или более поздней версии)

Пакет MICROSOFT HPC 2016 с обновлением 2 зависит от Microsoft .NET Framework 4.6.1. Если на компьютере нет установленной версии Microsoft .Net Framework 4.6.1 (или более поздней версии), пакет HPC пытается установить его и перезагрузить компьютер после установки. В этом случае можно снова запустить Setup.exe, чтобы продолжить установку пакета HPC после перезагрузки.

Установка Microsoft .NET Framework 4.6.1 завершается сбоем в Windows Server 2012 R2 или Windows 8.1 без установки KB2919355

Если вы устанавливаете пакет HPC 2016 с обновлением 2 в Windows Server 2012 R2 или Windows 8.1, перед установкой Microsoft .NET Framework 4.6.1 необходимо установить KB2919355.

Развертывание узла iSCSI не поддерживается

Развертывание узла без операционной системы поддерживается в пакете HPC 2016 с обновлением 2, но развертывание узла iSCSI по-прежнему не поддерживается.

NAT не поддерживается при настройке топологии сети

Конфигурация топологии сети завершается сбоем, если проверить NAT в мастере настройки сети. Обходной путь — отмена проверки NAT в мастере и включение NAT вручную в системе.

Несовместима с более низкой версией вычислительных узлов пакета HPC

Пакет HPC 2016 с обновлением 1 или более ранней версией вычислительного узла не поддерживается в пакете HPC 2016 с обновлением 2. Нам требуется обновить вычислительные узлы до той же версии головного узла.

Поддержка огромного количества задач в задании

Если вы хотите иметь более 30 тысяч задач или параметрических задач, необходимо изменить существующее v_TaskGroup представление в базе данных HPCScheduler, чтобы она была более эффективной, как показано ниже. Мы добавим это исправление в следующий выпуск QFE.

if object_id('v_TaskGroup') is not null
    drop view v_TaskGroup
go

create view v_TaskGroup as
select tg.JobID, tg.ID
, COUNT(case when (t.State & 0x1 > 0) then 1 else null end) as Configuring
, COUNT(case when (t.State & 0x2 > 0) then 1 else null end) as Submitted
, COUNT(case when (t.State & 0x4 > 0) then 1 else null end) as Validating
, COUNT(case when (t.State & 0x8 > 0) then 1 else null end) as Queued
, COUNT(case when (t.State & 0x10 > 0) then 1 else null end) as Dispatching
, COUNT(case when (t.State & 0x20 > 0) then 1 else null end) as Running
, COUNT(case when (t.State & 0x40 > 0) then 1 else null end) as Finishing
, COUNT(case when (t.State & 0x80 > 0) then 1 else null end) as Finished
, COUNT(case when (t.State & 0x100 > 0) then 1 else null end) as Failed
, COUNT(case when (t.State & 0x200 > 0) then 1 else null end) as Canceled
, COUNT(case when (t.State & 0x400 > 0) then 1 else null end) as Canceling
from TaskGroup tg
left join TaskDetail td on td.GroupId = tg.id
left join Task t on td.RecordID = t.RecordID
group by tg.JobId, tg.ID
go

Некоторые вычислительные узлы IaaS Azure не запускались

Некоторые вычислительные узлы IaaS Azure могут не запускаться из-за сбоя выделения виртуальной машины или времени ожидания подготовки. Вы можете открыть диспетчер кластеров HPC, выбрать неработоспособный узел управления ресурсами и щелкнуть журнал подготовки, чтобы проверить подробную ошибку. Наиболее возможные причины сбоя и обходные пути:

  • Превышено ограничение квоты ядра: увеличьте базовую квоту подписки Azure.

  • Недостаточно емкости для запрошенного размера виртуальной машины: если не удалось создать узлы IaaS в группе доступности, попробуйте остановить все узлы IaaS в одной группе доступности и запустить их снова, см. здесь дополнительные сведения. Если не удалось создать узлы IaaS в группе доступности, требуемый размер виртуальной машины пока недоступен в целом регионе, вы можете повторить попытку позже или добавить новые узлы с другими размерами виртуальных машин.

  • Время ожидания узла ожидания (по умолчанию 60 минут): проверьте узел на портале Azure, если он завис в подготовке, попробуйте удалить, если на портале и снова запустить узел из диспетчера кластеров пакетов HPC.