Поделиться через


Использование gpu с кластеризованными виртуальными машинами

Область применения: локальная версия Azure, версии 23H2 и 22H2

Примечание.

Рекомендуемый способ создания виртуальных машин и управления ими в локальной версии Azure версии 23H2 использует плоскость управления Azure Arc. Используйте механизм, описанный ниже, для управления виртуальными машинами только в том случае, если вам нужны функциональные возможности, недоступные в виртуальных машинах Azure Arc.

Вы можете включить gpu в кластеры, чтобы обеспечить ускорение GPU для рабочих нагрузок, работающих в кластеризованных виртуальных машинах. Ускорение GPU можно обеспечить с помощью дискретного назначения устройств (DDA), что позволяет выделить один или несколько физических GPU на виртуальную машину или секционирование GPU. Кластеризованные виртуальные машины могут воспользоваться преимуществами ускорения GPU и кластеризации, такими как высокая доступность с помощью отработки отказа. Динамическая миграция виртуальных машин (виртуальных машин) в настоящее время не поддерживается, но виртуальные машины можно автоматически перезапустить и поместить, где доступны ресурсы GPU, если произошел сбой.

В этой статье вы узнаете, как использовать единицы обработки графики (GPU) с кластеризованными виртуальными машинами, чтобы обеспечить ускорение GPU для рабочих нагрузок с помощью дискретного назначения устройств. В этой статье описано, как подготовить кластер, назначить GPU виртуальной машине кластера и выполнить отработку отказа этой виртуальной машины с помощью Центра администрирования Windows и PowerShell.

Необходимые компоненты

Перед началом использования gpu с кластеризованными виртуальными машинами необходимо учитывать несколько требований и вещей.

  • Вам нужен кластер Azure Stack HCI под управлением Azure Stack HCI версии 22H2 или более поздней версии.
  • Вам нужен отказоустойчивый кластер Windows Server под управлением Windows Server 2025 или более поздней версии.
  • Необходимо установить одну и ту же модель gpu на всех серверах в кластере.

  • Просмотрите и следуйте инструкциям производителя GPU, чтобы установить необходимые драйверы и программное обеспечение на каждом сервере в кластере.

  • В зависимости от поставщика оборудования может потребоваться также настроить все требования к лицензированию GPU.

  • Вам нужен компьютер с установленным Windows Admin Center. Этот компьютер может быть одним из узлов кластера.

Примечание.

Ваша система должна поддерживать решение Azure Stack HCI с поддержкой GPU. Чтобы просмотреть параметры, посетите каталог Azure Stack HCI.

Подготовка кластера

По завершении предварительных требований можно подготовить кластер для использования GPU с кластеризованными виртуальными машинами.

Подготовка кластера включает создание пула ресурсов, содержащего графические процессоры, доступные для назначения виртуальным машинам. Кластер использует этот пул для определения размещения виртуальных машин для всех запущенных или перемещенных виртуальных машин, назначенных пулу ресурсов GPU.

С помощью Windows Admin Center выполните следующие действия, чтобы подготовить кластер для использования GPU с кластеризованными виртуальными машинами.

Чтобы подготовить кластер и назначить виртуальную машину пулу ресурсов GPU, выполните следующие действия.

  1. Запустите Windows Admin Center и убедитесь, что расширение GPU уже установлено.

  2. Выберите Диспетчер кластеров в раскрывающемся меню и подключитесь к кластеру.

  3. В меню "Параметры" выберите расширения>GPU.

  4. В меню "Сервис" в разделе "Расширения" выберите графические процессоры, чтобы открыть средство.

    Снимок экрана: средство GPU в Windows Admin Center.

  5. На главной странице средства выберите вкладку пулов GPU и выберите команду "Создать пул GPU".

    Снимок экрана: страница

  6. На странице "Новый пул GPU" укажите следующее, а затем нажмите кнопку "Сохранить".

    1. Имя сервера
    2. Имя пула GPU
    3. Графические процессоры , которые необходимо добавить в пул

    Снимок экрана: страница

    После завершения процесса появится запрос на успешное выполнение, в котором отображается имя нового пула GPU и сервера узла.

Назначение виртуальной машины пулу ресурсов GPU

Теперь вы можете назначить виртуальную машину пулу ресурсов GPU. Можно назначить одну или несколько виртуальных машин кластеризованному пулу ресурсов GPU и удалить виртуальную машину из кластеризованного пула ресурсов GPU.

Выполните следующие действия, чтобы назначить существующую виртуальную машину пулу ресурсов GPU с помощью Windows Admin Center.

Примечание.

Кроме того, необходимо установить драйверы от производителя GPU на виртуальной машине, чтобы приложения на виртуальной машине могли воспользоваться преимуществами GPU, назначенными им.

  1. На странице "Назначение виртуальной машины пулу GPU" укажите следующее, а затем нажмите кнопку "Назначить".

    1. Имя сервера
    2. Имя пула GPU
    3. Виртуальная машина , которой требуется назначить GPU из пула GPU.

    Можно также определить дополнительные значения параметров для пространств, сопоставленных с памятью (MMIO), чтобы определить требования к ресурсам для одного GPU.

    Снимок экрана: страница

    После завершения процесса вы получите запрос подтверждения, показывающий успешное назначение GPU из пула ресурсов GPU виртуальной машине, которая отображается под назначенными виртуальными машинами.

    Снимок экрана: запрос успешного выполнения, показывающий GPU, назначенный виртуальной машине, и виртуальную машину, отображаемую в разделе

Чтобы отменить назначение виртуальной машины из пула ресурсов GPU, выполните приведенные ниже действия.

  1. На вкладке пулов GPU выберите графический процессор, который требуется отменить, а затем выберите "Отменить назначение виртуальной машины".

  2. На странице "Отмена назначения виртуальной машины из пула GPU" в списке "Виртуальные машины" укажите имя виртуальной машины и выберите "Отменить назначение".

    Снимок экрана: страница

    После завершения процесса вы получите запрос на успешное выполнение, что виртуальная машина была не назначена из пула GPU, а в разделе "Состояние назначения" в GPU отображается доступное (не назначено).

При запуске виртуальной машины кластер гарантирует, что виртуальная машина размещается на сервере с доступными ресурсами GPU из этого пула на уровне кластера. Кластер также назначает GPU виртуальной машине через DDA, что позволяет получить доступ к GPU из рабочих нагрузок внутри виртуальной машины.

Отработка отказа виртуальной машины с назначенным GPU

Чтобы проверить возможность хранения рабочей нагрузки GPU кластера, выполните операцию очистки на сервере, на котором виртуальная машина работает с назначенным GPU. Чтобы очистить сервер, следуйте инструкциям в процедурах обслуживания отказоустойчивого кластера. Кластер перезапускает виртуальную машину на другом сервере в кластере, если другой сервер имеет достаточно доступных ресурсов GPU в созданном пуле.

Чтобы проверить возможность хранения рабочей нагрузки GPU кластера, выполните операцию очистки на сервере, на котором виртуальная машина работает с назначенным GPU. Чтобы очистить сервер, следуйте инструкциям в процедурах обслуживания отказоустойчивого кластера. Кластер перезапускает виртуальную машину на другом сервере в кластере, если другой сервер имеет достаточно доступных ресурсов GPU в созданном пуле.

Дополнительные сведения об использовании GPU с кластеризованными виртуальными машинами см. в следующих статье:

Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах: