Azure Stack Edge Pro GPU 디바이스용 GPU 가상 머신
적용 대상: Azure Stack Edge Pro - GPUAzure Stack Edge Pro 2Azure Stack Edge Pro R
Azure Stack Edge Pro GPU 디바이스의 GPU 가속 워크로드에는 GPU VM(가상 머신)이 필요합니다. 이 문서는 지원되는 OS, GPU 드라이버 및 VM 크기를 포함하여 GPU VM에 대한 개요를 제공합니다. Kubernetes 클러스터에 사용되는 GPU VM에 대한 배포 옵션도 설명합니다.
GPU VM 정보
Azure Stack Edge 디바이스에는 Nvidia의 Tesla T4 또는 Tensor Core A2 GPU 중 1~2개가 장착될 수 있습니다. 이러한 디바이스에 GPU 가속 VM 워크로드를 배포하려면 GPU 최적화 VM 크기를 사용합니다. 선택한 GPU VM은 Azure Stack Edge 디바이스의 GPU 구성과 일치해야 합니다. 자세한 내용은 지원되는 N 시리즈 GPU 최적화 VM을 참조하세요.
Azure N 시리즈 VM의 GPU 기능을 최대한 활용하려면 Nvidia GPU 드라이버를 설치해야 합니다. Nvidia GPU 드라이버 확장은 Nvidia CUDA 또는 GRID 드라이버를 설치합니다. 템플릿을 사용하거나 Azure Portal을 통해 GPU 확장을 설치할 수 있습니다.
VM 배포 후 Azure Resource Manager 템플릿을 사용하여 확장을 설치 및 관리할 수 있습니다. Azure Portal에서 VM 배포 도중 또는 그 이후 GPU 확장을 설치합니다. 해당 지침은 Azure Stack Edge 디바이스에서 GPU VM 배포를 참조하세요.
디바이스에 Kubernetes 클러스터가 구성된 경우 GPU VM을 배포하기 전에 Kubernetes 클러스터에 대한 배포 고려 사항을 검토해야 합니다.
지원되는 OS 및 GPU 드라이버
Windows 및 Linux용 Nvidia GPU 드라이버 확장은 다음 OS 버전을 지원합니다.
Windows용 GPU 확장에 대해 지원되는 OS
이 확장은 다음 운영 체제(OS)를 지원합니다. 다른 버전은 작동할 수 있지만 Azure Stack Edge 디바이스에서 실행되는 GPU VM에서 사내에서 테스트되지 않았습니다.
배포 | 버전 |
---|---|
Windows Server 2019 | 핵심 |
Windows Server 2016 | 핵심 |
Linux용 GPU 확장에 대해 지원되는 OS
이 확장은 특정 OS 버전에 대한 드라이버 지원에 따라 다음 OS 배포판을 지원합니다. 다른 버전은 작동할 수 있지만 Azure Stack Edge 디바이스에서 실행되는 GPU VM에서 사내에서 테스트되지 않았습니다.
배포 | 버전 |
---|---|
Red Hat Enterprise Linux | 7.4 |
참고 항목
Ubuntu 18.04 LTS GPU 확장은 더 이상 사용되지 않습니다. GPU 확장은 Azure Stack Edge 장치에서 실행되는 Ubuntu 18.04 GPU VM에서 더 이상 지원되지 않습니다. Ubuntu 버전 18.04 LTS 배포판을 사용하려는 경우 CUDA 도구 키트 12.1 업데이트 1 다운로드에서 수동 GPU 드라이버 설치 단계를 참조하세요. 설치하기 전에 CUDA 서명 키를 다운로드해야 할 수 있습니다. 서명 키를 설치하는 예제는 Azure Stack Edge Pro GPU의 GPU VM에 대한 GPU 확장 문제 해결을 참조하세요.
GPU VM 배포
Azure Portal을 통해 또는 Azure Resource Manager 템플릿을 사용하여 GPU VM을 배포할 수 있습니다. GPU 확장은 VM을 만든 후에 설치됩니다.
포털: Azure Portal에서 VM을 만들 때 또는 VM을 배포한 후에 GPU 확장을 빠르게 설치할 수 있습니다.
템플릿: Azure Resource Manager 템플릿을 사용하여 VM을 만들고, 이후 GPU 확장을 설치합니다.
GPU VM 및 Kubernetes
디바이스에 GPU VM을 배포하기 전에 디바이스에 Kubernetes가 구성된 경우 다음 고려 사항을 검토하세요.
1-GPU 디바이스:
GPU VM을 만들고 디바이스에서 Kubernetes 구성: 이 시나리오에서는 GPU VM 만들기 및 Kubernetes 구성이 모두 성공합니다. 이 경우 Kubernetes는 GPU에 액세스할 수 없습니다.
디바이스에서 Kubernetes를 구성한 다음 GPU VM을 만듭니다. 이 시나리오에서 Kubernetes는 디바이스에서 GPU를 주장하고 사용할 수 있는 GPU 리소스가 없으므로 VM 만들기가 실패합니다.
2-GPU 디바이스
GPU VM을 만든 다음, 디바이스에서 Kubernetes 구성: 이 시나리오에서는 만든 GPU VM이 디바이스에서 하나의 GPU를 클레임하고 Kubernetes 구성도 성공하고 남은 하나의 GPU를 클레임합니다.
디바이스에서 Kubernetes 구성 뒤에 두 개의 GPU VM을 만듭니다. 이 시나리오에서는 두 GPU VM이 디바이스에서 두 GPU를 클레임하고 Kubernetes는 GPU 없이 성공적으로 구성됩니다.
디바이스에서 Kubernetes를 구성한 다음 GPU VM을 만듭니다. 이 시나리오에서 Kubernetes는 GPU 리소스를 사용할 수 없으므로 디바이스의 GPU와 VM 생성이 모두 실패할 것이라고 주장합니다.
다음 단계
- GPU VM을 배포하는 방법을 알아봅니다.
- 디바이스에서 실행 중인 GPU VM에서 GPU 확장을 설치하는 방법을 알아봅니다.