Использование gpu с кластеризованными виртуальными машинами
Область применения: локальная версия Azure, версии 23H2 и 22H2
Примечание.
Рекомендуемый способ создания виртуальных машин и управления ими в локальной версии Azure версии 23H2 использует плоскость управления Azure Arc. Используйте механизм, описанный ниже, для управления виртуальными машинами только в том случае, если вам нужны функциональные возможности, недоступные в виртуальных машинах Azure Arc.
Вы можете включить gpu в кластеры, чтобы обеспечить ускорение GPU для рабочих нагрузок, работающих в кластеризованных виртуальных машинах. Ускорение GPU можно обеспечить с помощью дискретного назначения устройств (DDA), что позволяет выделить один или несколько физических GPU на виртуальную машину или секционирование GPU. Кластеризованные виртуальные машины могут воспользоваться преимуществами ускорения GPU и кластеризации, такими как высокая доступность с помощью отработки отказа. Динамическая миграция виртуальных машин (виртуальных машин) в настоящее время не поддерживается, но виртуальные машины можно автоматически перезапустить и поместить, где доступны ресурсы GPU, если произошел сбой.
В этой статье вы узнаете, как использовать единицы обработки графики (GPU) с кластеризованными виртуальными машинами, чтобы обеспечить ускорение GPU для рабочих нагрузок с помощью дискретного назначения устройств. В этой статье описано, как подготовить кластер, назначить GPU виртуальной машине кластера и выполнить отработку отказа этой виртуальной машины с помощью Центра администрирования Windows и PowerShell.
Необходимые компоненты
Перед началом использования gpu с кластеризованными виртуальными машинами необходимо учитывать несколько требований и вещей.
- Вам нужен кластер Azure Stack HCI под управлением Azure Stack HCI версии 22H2 или более поздней версии.
- Вам нужен отказоустойчивый кластер Windows Server под управлением Windows Server 2025 или более поздней версии.
Необходимо установить одну и ту же модель gpu на всех серверах в кластере.
Просмотрите и следуйте инструкциям производителя GPU, чтобы установить необходимые драйверы и программное обеспечение на каждом сервере в кластере.
В зависимости от поставщика оборудования может потребоваться также настроить все требования к лицензированию GPU.
Вам нужен компьютер с установленным Windows Admin Center. Этот компьютер может быть одним из узлов кластера.
Создайте виртуальную машину для назначения GPU. Подготовьте виртуальную машину для DDA, задав его поведение кэша, действие остановки и сопоставленные с памятью свойства ввода-вывода (MMIO) в соответствии с инструкциями по развертыванию графических устройств с помощью дискретного назначения устройств.
Подготовьте графические процессоры на каждом сервере, установив драйверы для устранения рисков безопасности на каждом сервере, отключив графические процессоры и отключив их от узла. Дополнительные сведения об этом процессе см. в статье "Развертывание графических устройств с помощью дискретного назначения устройств".
Выполните действия, описанные в разделе "Планирование развертывания устройств с помощью дискретного назначения устройств" для подготовки устройств GPU в кластере.
Убедитесь, что на устройстве достаточно места MMIO, выделенного на виртуальной машине. Дополнительные сведения см. в разделе MMIO Space.
Создайте виртуальную машину для назначения GPU. Подготовьте виртуальную машину для DDA, задав его поведение кэша, действие остановки и сопоставленные с памятью свойства ввода-вывода (MMIO) в соответствии с инструкциями по развертыванию графических устройств с помощью дискретного назначения устройств.
Подготовьте графические процессоры на каждом сервере, установив драйверы для устранения рисков безопасности на каждом сервере, отключив графические процессоры и отключив их от узла. Дополнительные сведения об этом процессе см. в статье "Развертывание графических устройств с помощью дискретного назначения устройств".
Примечание.
Ваша система должна поддерживать решение Azure Stack HCI с поддержкой GPU. Чтобы просмотреть параметры, посетите каталог Azure Stack HCI.
Подготовка кластера
По завершении предварительных требований можно подготовить кластер для использования GPU с кластеризованными виртуальными машинами.
Подготовка кластера включает создание пула ресурсов, содержащего графические процессоры, доступные для назначения виртуальным машинам. Кластер использует этот пул для определения размещения виртуальных машин для всех запущенных или перемещенных виртуальных машин, назначенных пулу ресурсов GPU.
С помощью Windows Admin Center выполните следующие действия, чтобы подготовить кластер для использования GPU с кластеризованными виртуальными машинами.
Чтобы подготовить кластер и назначить виртуальную машину пулу ресурсов GPU, выполните следующие действия.
Запустите Windows Admin Center и убедитесь, что расширение GPU уже установлено.
Выберите Диспетчер кластеров в раскрывающемся меню и подключитесь к кластеру.
В меню "Параметры" выберите расширения>GPU.
В меню "Сервис" в разделе "Расширения" выберите графические процессоры, чтобы открыть средство.
На главной странице средства выберите вкладку пулов GPU и выберите команду "Создать пул GPU".
На странице "Новый пул GPU" укажите следующее, а затем нажмите кнопку "Сохранить".
- Имя сервера
- Имя пула GPU
- Графические процессоры , которые необходимо добавить в пул
После завершения процесса появится запрос на успешное выполнение, в котором отображается имя нового пула GPU и сервера узла.
Назначение виртуальной машины пулу ресурсов GPU
Теперь вы можете назначить виртуальную машину пулу ресурсов GPU. Можно назначить одну или несколько виртуальных машин кластеризованному пулу ресурсов GPU и удалить виртуальную машину из кластеризованного пула ресурсов GPU.
Выполните следующие действия, чтобы назначить существующую виртуальную машину пулу ресурсов GPU с помощью Windows Admin Center.
Примечание.
Кроме того, необходимо установить драйверы от производителя GPU на виртуальной машине, чтобы приложения на виртуальной машине могли воспользоваться преимуществами GPU, назначенными им.
На странице "Назначение виртуальной машины пулу GPU" укажите следующее, а затем нажмите кнопку "Назначить".
- Имя сервера
- Имя пула GPU
- Виртуальная машина , которой требуется назначить GPU из пула GPU.
Можно также определить дополнительные значения параметров для пространств, сопоставленных с памятью (MMIO), чтобы определить требования к ресурсам для одного GPU.
После завершения процесса вы получите запрос подтверждения, показывающий успешное назначение GPU из пула ресурсов GPU виртуальной машине, которая отображается под назначенными виртуальными машинами.
Чтобы отменить назначение виртуальной машины из пула ресурсов GPU, выполните приведенные ниже действия.
На вкладке пулов GPU выберите графический процессор, который требуется отменить, а затем выберите "Отменить назначение виртуальной машины".
На странице "Отмена назначения виртуальной машины из пула GPU" в списке "Виртуальные машины" укажите имя виртуальной машины и выберите "Отменить назначение".
После завершения процесса вы получите запрос на успешное выполнение, что виртуальная машина была не назначена из пула GPU, а в разделе "Состояние назначения" в GPU отображается доступное (не назначено).
При запуске виртуальной машины кластер гарантирует, что виртуальная машина размещается на сервере с доступными ресурсами GPU из этого пула на уровне кластера. Кластер также назначает GPU виртуальной машине через DDA, что позволяет получить доступ к GPU из рабочих нагрузок внутри виртуальной машины.
Отработка отказа виртуальной машины с назначенным GPU
Чтобы проверить возможность хранения рабочей нагрузки GPU кластера, выполните операцию очистки на сервере, на котором виртуальная машина работает с назначенным GPU. Чтобы очистить сервер, следуйте инструкциям в процедурах обслуживания отказоустойчивого кластера. Кластер перезапускает виртуальную машину на другом сервере в кластере, если другой сервер имеет достаточно доступных ресурсов GPU в созданном пуле.
Чтобы проверить возможность хранения рабочей нагрузки GPU кластера, выполните операцию очистки на сервере, на котором виртуальная машина работает с назначенным GPU. Чтобы очистить сервер, следуйте инструкциям в процедурах обслуживания отказоустойчивого кластера. Кластер перезапускает виртуальную машину на другом сервере в кластере, если другой сервер имеет достаточно доступных ресурсов GPU в созданном пуле.
Связанный контент
Дополнительные сведения об использовании GPU с кластеризованными виртуальными машинами см. в следующих статье:
Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах: