Упражнение. Создание кластера HPC из встроенных шаблонов
Вы можете создавать новые кластеры непосредственно из графического интерфейса веб-приложения Azure CycleCloud. CycleCloud предлагает множество стандартных шаблонов, предназначенных для различных планировщиков, которые упрощают развертывание кластера для этих планировщиков.
Теперь, когда вы подготовили виртуальную машину Azure, включающую веб-приложения CycleCloud, вы можете оценить его использование для развертывания кластера HPC на основе Slurm в Azure. Сначала необходимо убедиться, что подписка Azure соответствует требованиям к ресурсам кластера. Вы также хотите рассмотреть вопрос о том, хочет ли ваша команда управления сохранить затраты кластера в бюджете проекта. Таким образом, вы планируете настроить оповещения о бюджете в CycleCloud и вывести из эксплуатации лабораторную среду после завершения оценки.
В этом упражнении вы выполните шаги по развертыванию кластера HPC на основе Slurm в Azure с помощью Azure CycleCloud. Упражнение состоит из следующих задач:
- Задача 1. Подготовка к развертыванию кластера HPC
- Задача 2. Создание кластера HPC с помощью Azure CycleCloud
- Задача 3. Настройка и запуск кластера HPC с помощью Azure CycleCloud
- Задача 4. Очистка лабораторной среды
Задача 1. Подготовка к развертыванию кластера HPC
Перед развертыванием кластера HPC необходимо сначала убедиться, что у вас достаточно сетевых и вычислительных ресурсов, чтобы обеспечить его использование.
Заметка
Чтобы выполнить это упражнение, вам не нужно удовлетворять требованиям квоты для подготовки вычислительных узлов, так как вы не будете запускать задания в создаваемом кластере. Тем не менее, если это так, вы можете заметить несоответствие между скриншотами в этом упражнении и веб-интерфейсом CycleCloud, так как в CycleCloud не будут предварительно созданы временные вычислительные узлы, если у вас нет достаточного количества доступных ядер.
На компьютере перейдите в окно веб-браузера, отображающее портал Azure.
На портале Azure используйте поле поиска в верхней части интерфейса портала для поиска группы ресурсов cyclecloud-rg.
На портале Azure на странице cyclecloud-rg в списке ресурсов выберите запись cyclecloud-rg-vnet, представляющую виртуальную сеть, подготовленную в предыдущем упражнении этого модуля.
На странице cyclecloud-rg-vnet в вертикальном меню слева выберите Подсети.
На панели cyclecloud-rg-vnet | Подсети выберите + Подсеть.
В области Добавление подсети в текстовом поле Имя введите contoso-slurm-lab-cluster-subnet, примите диапазон подсети по умолчанию и выберите Сохранить.
Заметка
Рекомендуется разделять подсеть, на котором размещена виртуальная машина CycleCloud Azure от подсетей, где размещаются вычислительные ресурсы кластера. Для больших кластеров следует выделить достаточно крупные диапазоны IP-адресов.
На портале Azure используйте поле поиска для поиска подписок.
На странице подписки выберите подписку Azure, используемую для упражнений в этом модуле.
На странице с подпиской Azure в вертикальном меню слева в разделе «Настройки» выберите «Использование и квоты».
На панели Использование и квоты настройте следующие параметры фильтрации (оставьте другие значения по умолчанию):
Настройка Ценность Выбор службы Выберите записи виртуальных ЦП семейства Standard Dv3, виртуальных ЦП семейства Standard FSv2, и всего региональных виртуальных ЦП. Выбор поставщика Выберите запись Microsoft.Compute. Выбор расположения Выберите имя региона Azure, в котором планируется развернуть кластер в этом упражнении. Просмотрите выходные данные и определите количество доступных виртуальных ЦП в каждой группе.
Задача 2. Создание кластера HPC с помощью Azure CycleCloud
Теперь у вас есть веб-приложение CycleCloud, установленное на виртуальной машине Azure, достаточно ядер виртуального ЦП, доступных в подписке Azure, и назначенная подсеть сети, которая может выполнять автоматическое масштабирование узлов кластера. Вы готовы продолжить развертывание кластера на основе Slurm.
На компьютере в окне веб-браузера, на странице Подписки веб-приложения Azure CycleCloud, выберите в левом верхнем углу ссылку "Назад к кластерам".
На странице Создание нового кластера просмотрите доступные параметры и в разделе «Планировщики» выберите Slurm.
На вкладке "О" "Новый кластер Slurm" в текстовом поле имя кластера введите contoso-slurm-lab-cluster.
На вкладке Настройки по умолчанию страницы Создание кластера Slurm в текстовом поле Имя кластера настройте следующие параметры (оставьте остальные со значениями по умолчанию):
Настройка Ценность Область Выберите имя региона Azure, в котором планируется развернуть кластер в этом упражнении. Тип виртуальной машины планировщика Выберите , а затем в всплывающем окне Выберите тип компьютера, в текстовом поле Поиск SKU введите "D2ds_v5". В списке результатов установите флажок рядом с записью D2ds_v5 и выберите Применить. Настройка Ценность Максимальное число ядер HPC Введите 100 Max HTC Cores Введите 100 Максимальное количество виртуальных машин на масштабируемом наборе Введите 40 Идентификатор подсети Выберите cyclecloud-rg: cyclecloud-rg-vnet-contoso-slurm-lab-cluster-subnet Заметка
Параметр Максимальное количество виртуальных машин в масштабируемом наборе ограничивает максимальный размер задачи с использованием интерфейса передачи сообщений, которая может выполняться на кластере, поскольку масштабируемый набор в настоящее время является границей структуры InfiniBand.
На вкладке подключенного к сети хранилищановой кластера Slurm убедитесь, что типа NFS задано значение Builtin. Примите значение по умолчанию размера ГБ, которое равно 100, и нажмите кнопку Далее.
На вкладке дополнительных параметров страницы "Новый кластер Slurm" просмотрите доступные параметры без внесения изменений, а затем нажмите кнопку Далее.
На вкладке Cloud-init страницы Новый кластер Slurm просмотрите доступные параметры без внесения изменений, а затем выберите Сохранить.
Задача 3. Настройка и запуск кластера HPC с помощью Azure CycleCloud
Чтобы подготовиться к работе кластера, задайте оповещения, чтобы уведомить вас, когда затраты на использование кластера достигают бюджета, выделенного по стоимости ресурсов Azure. Вы также проверяете развертывание, запуская кластер с графическим интерфейсом веб-приложения CycleCloud.
На компьютере в веб-браузере отображается графический интерфейс веб-приложения Azure CycleCloud, просмотрите свойства только что развернутого кластера.
На странице contoso-slurm-lab-cluster выберите ссылку Создать новое предупреждение.
В всплывающем окне оповещения об использовании кластера contoso-slurm-lab-cluster укажите следующие параметры, а затем выберите Сохранить:
Настройка Ценность Бюджет $ 100,00 Посредством месяц Отправка уведомления включено Получатели cc-admin@contoso.com Вернитесь на страницу contoso-slurm-lab-cluster, выберите ссылку "Пуск", и когда появится запрос на подтверждение, выберите ОК.
Отслеживайте процесс запуска.
Заметка
Процесс включает подготовку виртуальной машины Azure, обслуживающей роль головного узла кластера, а также установку и настройку планировщика Slurm. Это может занять около пяти минут.
Задача 4. Очистка лабораторной среды
Вы завершили тестирование процесса развертывания кластера с помощью приложения Azure CycleCloud. Чтобы избежать ненужных затрат, связанных с использованием ресурсов Azure, завершите кластер и удалите все ресурсы, подготовленные на протяжении этого курса.
На вашем компьютере, в веб-браузере, отображающем графический интерфейс веб-приложения Azure CycleCloud, на странице contoso-slurm-lab-cluster, выберите ссылку Terminate и при появлении запроса на подтверждение нажмите кнопку OK.
Отслеживайте процесс завершения.
Заметка
Процесс включает удаление виртуальной машины Azure, исполняющей роль головного узла кластера. Это может занять около пяти минут.
Заметка
Необходимо удалить ресурсы, развернутые в рамках этого упражнения, как описано в этой задаче. Если вы не удаляете ресурсы, вам может потребоваться дополнительная плата за подписку.
Заметка
Чтобы удалить все другие ресурсы, которые вы создали в этой лаборатории, удалите группу ресурсов cyclecloud-rg.
На компьютере перейдите в окно браузера, отображающее портал Azure.
На портале Azure перейдите в колонку cyclecloud-rg. Выберите Удалить группу ресурсов на панели инструментов и в текстовом поле Введите имя группы ресурсов, введите cyclecloud-rg, а затем выберите Удалить.
Повторите предыдущий шаг, чтобы удалить группу ресурсов с именем, начиная с contoso-slurm-lab-cluster-, содержащей ресурс диска, используемый кластером.
Поздравляю! Вы успешно выполнили второе упражнение этого модуля. Вы обеспечили доступность вычислительных ресурсов и сетевых ресурсов, необходимых для развертывания нового кластера. Затем вы развернули кластер с помощью Azure CycleCloud, настроили оповещения о бюджете и запустили его для проверки его функциональности. Наконец, вы завершили кластер и удалили все ресурсы, подготовленные в этом модуле, чтобы избежать ненужных затрат.