Выбор соответствующего номера SKU HPC

Завершено

У вашей команды исследований и разработок есть несколько вариантов HPC, доступных в Azure. В приведенной ниже таблице представлены основные технические различия между номерами SKU HB120_v2, HC44 и HB60. Наличие нескольких номеров SKU HPC дает возможность выбрать подходящий номер SKU для характеристик производительности приложения HPC.

Выделенные элементы указывают, какая виртуальная машина HPC является лучшей и предпочтительной в определенной категории.

HB120_v2 HC44 HB60
Процессор AMD EPYC 7742 (Rome) Intel Platinum 8168 AMD EPYC 7551 (Naples)
Без ядер (SMT отключен) 120 44 60
Базовая частота ЦП 2,45 ГГц 2.7 GHz 2,0 ГГц
Поддержка AVX 512 Нет (16 FLOPS на ядро) Yes (32 FLOPS на ядро) Нет (8 FLOPS на ядро)
Теоретические MFLOPS (FP64) ~4000 ~3000 ~1000
Домены NUMA 30 2 15
Максимальный размер задания MPI 36000 cores 13 200 ядер 18 000 ядер
Размер памяти 480 GB 352 ГБ 240 ГБ
Пропускная способность памяти 340 GB/s 190 ГБ/с 260 ГБ/с
InfiniBand 200 GB HDR (задержка ~ 1,2 мкс) 100 ГБ EDR (задержка ~1,8 мкс) 100 ГБ EDR (задержка ~1,9 мкс)
Размер локального SSD 960 GB (NVMeDirect), 480 GB 700 ГБ 700 ГБ
Максимальное количество подключенных дисков 8 4 4
Соотношение затрат 1,58 1,39 1.0

Причины для выбора HC44

  • Приложение HPC привязано к плавающей запятой и требует поддержки AVX 512.
  • Приложение HPC чувствительно к частоте ЦП и, как правило, лучше работает с более высокой тактовой частотой.
  • Корпорация Intel имеет развитую экосистему разработки, которая упрощает разработку и запуск приложений.
  • У вас большой опыт работы с процессорами Intel, и вы предпочитаете их использовать.

Причины для выбора HB120_v2

  • Приложение HPC привязано к плавающей запятой и использует все доступные ядра.
  • Приложение HPC привязано к пропускной способности памяти.
  • Тесно связанное приложение HPC имеет ограничения по сети и чувствительно к задержкам и пропускной способности.
  • Тесно связанное приложение HPC очень масштабируемо, и вы планируете запустить приложение с более чем 18 000 ядрами.
  • Вашему приложению требуется высокоскоростной локальный NVMe SSD, поддерживающий NVMeDirect.
  • Для приложения требуется более четырех управляемых дисков на каждой виртуальной машине.

Причины для выбора HB60

  • Приложение HPC использует <= 60 ядер на виртуальную машину.
  • Приложение HPC больше ограничено по памяти, чем по операциям с плавающей запятой.
  • Приложение HPC масштабируется до меньшего общего количества ядер менее 18 000 ядер.