적절한 HPC SKU를 선택합니다.
R&D 팀에는 Azure에서 사용할 수 있는 여러 개의 HPC 옵션이 있으며, 다음 표에는 HB120_v2, HC44, HB60 SKU 간의 주요 기술적 차이점이 강조되어 있습니다. 선택할 수 있는 HPC SKU가 여러 개 있으므로 HPC 애플리케이션의 성능 특성에 적합한 SKU를 선택할 수 있습니다.
강조 표시된 항목은 특정 범주에서 가장 강력하고 선호되는 HPC 가상 머신을 나타냅니다.
HB120_v2 | HC44 | HB60 | |
---|---|---|---|
프로세서 | AMD EPYC 7742(Rome) | Intel Platinum 8168 | AMD EPYC 7551(Naples) |
코어 없음(SMT 사용 안 함) | 120 |
44 | 60 |
CPU 기본 주수 | 2.45GHz | 2.7 GHz |
2.0GHz |
AVX 512 지원 | 아니요(코어당 16FLOPS) | Yes (코어당 32FLOPS) |
아니요(코어당 8FLOPS) |
이론적 FLOPS(FP64) | ~4000 |
~3,000 | ~1,000 |
NUMA 도메인 | 30 | 2 |
15 |
최대 MPI 작업 크기 | 36000 cores |
13,200개 코어 | 18,000개 코어 |
메모리 크기 | 480 GB |
352GB | 240GB |
메모리 대역폭 | 340 GB/s |
190GB/s | 260GB/s |
InfiniBand | 200 GB HDR (대기 시간~1.2μs) |
100 GB EDR(대기 시간 ~1.8 μs) | 100 GB EDR (대기 시간 ~1.9 μs) |
로컬 SSD 크기 | 960 GB (NVMeDirect), 480 GB |
700GB | 700GB |
연결된 디스크 최대 개수 | 8 |
4 | 4 |
비용 비율 | 1.58 | 1.39 | 1.0 |
HC44를 선택하는 이유
- HPC 애플리케이션이 부동 소수점 바인딩되고 AVX 512 지원이 필요합니다.
- HPC 애플리케이션이 CPU 주파수에 민감하며 일반적으로 클록 주파수가 높을수록 성능이 뛰어납니다.
- Intel에는 발달된 개발 에코시스템이 있어서 더 용이하게 애플리케이션을 개발하고 실행할 수 있습니다.
- Intel 프로세서를 사용한 기간 및 경험이 많아 Intel 프로세서를 선호합니다.
HB120_v2를 선택하는 이유
- HPC 애플리케이션은 부동 소수점 기반이며 사용 가능한 모든 코어를 사용합니다.
- HPC 애플리케이션이 메모리 대역폭에 바인딩됩니다.
- 밀결합된 HPC 애플리케이션이 네트워크에 바인딩되고 대기 시간 및 대역폭에 민감합니다.
- 긴밀하게 결합된 HPC 애플리케이션은 스케일링 성능이 뛰어나며, 18,000개를 초과하는 코어에서 애플리케이션을 실행할 계획입니다.
- 애플리케이션에 NVMeDirect를 지원하는 고속 로컬 NVMe SSD가 필요합니다.
- 애플리케이션에 VM당 4개 이상의 관리 디스크가 필요합니다.
HB60을 선택하는 이유
- HPC 애플리케이션은 VM당 <= 60개의 코어를 사용합니다.
- HPC 애플리케이션이 부동 소수점보다는 메모리에 더 바인딩됩니다.
- HPC 애플리케이션은 18,000개 미만의 총 코어 수로 크기 조정됩니다.