Использование gpu с кластеризованными виртуальными машинами

Статья
10/25/2024
Применяется к:

✅ Windows Server 2025, ✅ Windows Server 2022, ✅ Windows Server 2019, ✅ Windows Server 2016, ✅ Azure Local, versions 23H2 and 22H2

Область применения: локальная версия Azure, версии 23H2 и 22H2

Примечание.

Рекомендуемый способ создания виртуальных машин и управления ими в локальной версии Azure версии 23H2 использует плоскость управления Azure Arc. Используйте механизм, описанный ниже, для управления виртуальными машинами только в том случае, если вам нужны функциональные возможности, недоступные в виртуальных машинах Azure Arc.

Вы можете включить gpu в кластеры, чтобы обеспечить ускорение GPU для рабочих нагрузок, работающих в кластеризованных виртуальных машинах. Ускорение GPU можно обеспечить с помощью дискретного назначения устройств (DDA), что позволяет выделить один или несколько физических GPU на виртуальную машину или секционирование GPU. Кластеризованные виртуальные машины могут воспользоваться преимуществами ускорения GPU и кластеризации, такими как высокая доступность с помощью отработки отказа. Динамическая миграция виртуальных машин (виртуальных машин) в настоящее время не поддерживается, но виртуальные машины можно автоматически перезапустить и поместить, где доступны ресурсы GPU, если произошел сбой.

В этой статье вы узнаете, как использовать единицы обработки графики (GPU) с кластеризованными виртуальными машинами, чтобы обеспечить ускорение GPU для рабочих нагрузок с помощью дискретного назначения устройств. В этой статье описано, как подготовить кластер, назначить GPU виртуальной машине кластера и выполнить отработку отказа этой виртуальной машины с помощью Центра администрирования Windows и PowerShell.

Необходимые компоненты

Перед началом использования gpu с кластеризованными виртуальными машинами необходимо учитывать несколько требований и вещей.

Вам нужен кластер Azure Stack HCI под управлением Azure Stack HCI версии 22H2 или более поздней версии.

Вам нужен отказоустойчивый кластер Windows Server под управлением Windows Server 2025 или более поздней версии.

Необходимо установить одну и ту же модель gpu на всех серверах в кластере.
Просмотрите и следуйте инструкциям производителя GPU, чтобы установить необходимые драйверы и программное обеспечение на каждом сервере в кластере.
В зависимости от поставщика оборудования может потребоваться также настроить все требования к лицензированию GPU.
Вам нужен компьютер с установленным Windows Admin Center. Этот компьютер может быть одним из узлов кластера.

Создайте виртуальную машину для назначения GPU. Подготовьте виртуальную машину для DDA, задав его поведение кэша, действие остановки и сопоставленные с памятью свойства ввода-вывода (MMIO) в соответствии с инструкциями по развертыванию графических устройств с помощью дискретного назначения устройств.
Подготовьте графические процессоры на каждом сервере, установив драйверы для устранения рисков безопасности на каждом сервере, отключив графические процессоры и отключив их от узла. Дополнительные сведения об этом процессе см. в статье "Развертывание графических устройств с помощью дискретного назначения устройств".

Выполните действия, описанные в разделе "Планирование развертывания устройств с помощью дискретного назначения устройств" для подготовки устройств GPU в кластере.
Убедитесь, что на устройстве достаточно места MMIO, выделенного на виртуальной машине. Дополнительные сведения см. в разделе MMIO Space.
Создайте виртуальную машину для назначения GPU. Подготовьте виртуальную машину для DDA, задав его поведение кэша, действие остановки и сопоставленные с памятью свойства ввода-вывода (MMIO) в соответствии с инструкциями по развертыванию графических устройств с помощью дискретного назначения устройств.
Подготовьте графические процессоры на каждом сервере, установив драйверы для устранения рисков безопасности на каждом сервере, отключив графические процессоры и отключив их от узла. Дополнительные сведения об этом процессе см. в статье "Развертывание графических устройств с помощью дискретного назначения устройств".

Примечание.

Ваша система должна поддерживать решение Azure Stack HCI с поддержкой GPU. Чтобы просмотреть параметры, посетите каталог Azure Stack HCI.

Подготовка кластера

По завершении предварительных требований можно подготовить кластер для использования GPU с кластеризованными виртуальными машинами.

Подготовка кластера включает создание пула ресурсов, содержащего графические процессоры, доступные для назначения виртуальным машинам. Кластер использует этот пул для определения размещения виртуальных машин для всех запущенных или перемещенных виртуальных машин, назначенных пулу ресурсов GPU.

Windows Admin Center;
PowerShell

С помощью Windows Admin Center выполните следующие действия, чтобы подготовить кластер для использования GPU с кластеризованными виртуальными машинами.

Чтобы подготовить кластер и назначить виртуальную машину пулу ресурсов GPU, выполните следующие действия.

Запустите Windows Admin Center и убедитесь, что расширение GPU уже установлено.
Выберите Диспетчер кластеров в раскрывающемся меню и подключитесь к кластеру.
В меню "Параметры" выберите расширения>GPU.
В меню "Сервис" в разделе "Расширения" выберите графические процессоры, чтобы открыть средство.
На главной странице средства выберите вкладку пулов GPU и выберите команду "Создать пул GPU".
На странице "Новый пул GPU" укажите следующее, а затем нажмите кнопку "Сохранить".
1. Имя сервера
2. Имя пула GPU
3. Графические процессоры , которые необходимо добавить в пул
После завершения процесса появится запрос на успешное выполнение, в котором отображается имя нового пула GPU и сервера узла.

Выполните следующие действия, чтобы подготовить кластер для использования gpu с кластеризованными виртуальными машинами с помощью PowerShell.

Создайте пустой пул ресурсов на каждом сервере с кластеризованными ресурсами GPU. Обязательно укажите одно и то же имя пула на каждом сервере.

В PowerShell выполните следующий командлет от имени администратора:
```
 New-VMResourcePool -ResourcePoolType PciExpress -Name "GpuChildPool"
```
Добавьте отключенные GPU с каждого сервера в пул ресурсов, созданный на предыдущем шаге.

В PowerShell выполните следующие команды:
```
 $gpu = Get-VMHostAssignableDevice

 Add-VMHostAssignableDevice -HostAssignableDevice $gpu -ResourcePoolName "GpuChildPool"
```

Теперь у вас есть пул ресурсов на уровне кластера (с именем GpuChildPool), который заполняется назначаемыми gpu. Кластер использует этот пул для определения размещения виртуальных машин для всех запущенных или перемещенных виртуальных машин, назначенных пулу ресурсов GPU.

Назначение виртуальной машины пулу ресурсов GPU

Теперь вы можете назначить виртуальную машину пулу ресурсов GPU. Можно назначить одну или несколько виртуальных машин кластеризованному пулу ресурсов GPU и удалить виртуальную машину из кластеризованного пула ресурсов GPU.

Windows Admin Center;
PowerShell

Выполните следующие действия, чтобы назначить существующую виртуальную машину пулу ресурсов GPU с помощью Windows Admin Center.

Примечание.

Кроме того, необходимо установить драйверы от производителя GPU на виртуальной машине, чтобы приложения на виртуальной машине могли воспользоваться преимуществами GPU, назначенными им.

На странице "Назначение виртуальной машины пулу GPU" укажите следующее, а затем нажмите кнопку "Назначить".
1. Имя сервера
2. Имя пула GPU
3. Виртуальная машина , которой требуется назначить GPU из пула GPU.
Можно также определить дополнительные значения параметров для пространств, сопоставленных с памятью (MMIO), чтобы определить требования к ресурсам для одного GPU.

После завершения процесса вы получите запрос подтверждения, показывающий успешное назначение GPU из пула ресурсов GPU виртуальной машине, которая отображается под назначенными виртуальными машинами.

Чтобы отменить назначение виртуальной машины из пула ресурсов GPU, выполните приведенные ниже действия.

На вкладке пулов GPU выберите графический процессор, который требуется отменить, а затем выберите "Отменить назначение виртуальной машины".
На странице "Отмена назначения виртуальной машины из пула GPU" в списке "Виртуальные машины" укажите имя виртуальной машины и выберите "Отменить назначение".

После завершения процесса вы получите запрос на успешное выполнение, что виртуальная машина была не назначена из пула GPU, а в разделе "Состояние назначения" в GPU отображается доступное (не назначено).

Выполните следующие действия, чтобы назначить существующую виртуальную машину пулу ресурсов GPU с помощью PowerShell.

Настройте автономное действие force-shutdown ресурса виртуальной машины кластера по умолчанию, а не save. Обязательно замените <vmname> имя виртуальной машины, которую вы хотите назначить пулу ресурсов GPU.

В PowerShell выполните следующий командлет:
```
 Get-ClusterResource -name <vmname> | Set-ClusterParameter -Name "OfflineAction" -Value 3
```
Назначьте пул ресурсов, созданный ранее, виртуальной машине. Назначение пула ресурсов объявляет кластеру, которому требуется назначаемое устройство из GpuChildPool пула при запуске или перемещении.

В PowerShell выполните следующий командлет:
```
 Get-ClusterResource -name <vmname> | Add-VMAssignableDevice -ResourcePoolName "GpuChildPool"
```
Примечание.

Если вы хотите добавить несколько GPU на виртуальную машину, сначала убедитесь, что пул ресурсов имеет несколько доступных gpu, а затем снова выполните предыдущую команду.

Вы также можете удалить назначенный GPU из виртуальной машины. Для этого в PowerShell выполните следующую команду. Обязательно замените <vmname> имя виртуальной машины, которую вы хотите назначить пулу ресурсов GPU.
```
 Add-VMAssignableDevice -VMName $vm -ResourcePoolName "GpuChildPool"

 $vm | Remove-VMAssignableDevice
```

При запуске виртуальной машины кластер гарантирует, что виртуальная машина размещается на сервере с доступными ресурсами GPU из этого пула на уровне кластера. Кластер также назначает GPU виртуальной машине через DDA, что позволяет получить доступ к GPU из рабочих нагрузок внутри виртуальной машины.

Отработка отказа виртуальной машины с назначенным GPU

Чтобы проверить возможность хранения рабочей нагрузки GPU кластера, выполните операцию очистки на сервере, на котором виртуальная машина работает с назначенным GPU. Чтобы очистить сервер, следуйте инструкциям в процедурах обслуживания отказоустойчивого кластера. Кластер перезапускает виртуальную машину на другом сервере в кластере, если другой сервер имеет достаточно доступных ресурсов GPU в созданном пуле.

Дополнительные сведения об использовании GPU с кластеризованными виртуальными машинами см. в следующих статье:

Дополнительные сведения об использовании GPU с виртуальными машинами и секционированием GPU см. в следующих разделах:

Поделиться через

Использование gpu с кластеризованными виртуальными машинами

Необходимые компоненты

Подготовка кластера

Назначение виртуальной машины пулу ресурсов GPU

Отработка отказа виртуальной машины с назначенным GPU

Обратная связь

Дополнительные ресурсы

Поделиться через

Использование gpu с кластеризованными виртуальными машинами

Необходимые компоненты

Подготовка кластера

Назначение виртуальной машины пулу ресурсов GPU

Отработка отказа виртуальной машины с назначенным GPU

Связанный контент

Обратная связь

Дополнительные ресурсы