Azure HDInsight 클러스터에 적합한 VM 크기를 선택
이 문서에서는 HDInsight 클러스터의 다양한 노드에 적합한 VM 크기를 선택하는 방법을 설명합니다.
먼저 CPU 처리, RAM 크기 및 네트워크 대기 시간과 같은 가상 머신의 속성이 워크로드 처리에 미치는 영향을 이해합니다. 다음으로, 애플리케이션 및 애플리케이션이 다른 VM 제품군에 최적화된 항목과 어떻게 일치하는지 생각해 보세요. 사용하려는 VM 제품군이 배포하려는 클러스터 유형과 호환되는지 확인합니다. 각 클러스터 유형에 대해 지원되는 모든 권장 VM 크기 목록은 Azure HDInsight 지원 노드 구성을 참조하세요. 마지막으로 벤치마킹 프로세스를 사용하여 일부 샘플 워크로드를 테스트하고 해당 제품군 내의 SKU가 적합한지 확인할 수 있습니다.
스토리지 유형 또는 클러스터 크기 선택과 같은 클러스터의 다른 측면을 계획하는 데 대한 자세한 내용은 HDInsight 클러스터에 대한 용량 계획을 참조하세요.
VM 속성 및 빅 데이터 워크로드
VM 크기 및 유형은 CPU 처리 성능, RAM 크기 및 네트워크 대기 시간에 따라 결정됩니다.
CPU: VM 크기는 코어 수를 나타냅니다. 코어 수가 많을수록 각 노드가 달성할 수 있는 병렬 계산 수준이 높아집니다. 또한 일부 VM 유형은 더 빠른 코어를 포함합니다.
RAM: VM 크기는 VM에서 사용할 수 있는 RAM의 양을 나타내기도 합니다. 데이터를 디스크에서 읽지 않고, 처리를 위해 데이터를 메모리에 저장하는 워크로드의 경우, 작업자 노드에 데이터에 맞는 충분한 메모리가 있는지 확인합니다.
네트워크: 대부분의 클러스터 유형에서, 클러스터에 의해 처리된 데이터는 로컬 디스크에 저장되지 않고 Data Lake Storage 또는 Azure Storage와 같은 외부 스토리지 서비스에 저장됩니다. 노드 VM 및 스토리지 서비스 간의 네트워크 대역폭과 처리량을 고려합니다. VM에 사용할 수 있는 네트워크 대역폭은 일반적으로 더 크게 늘어납니다. 자세한 내용은 VM 크기 개요를 참조하세요.
VM 최적화 이해
Azure의 가상 머신 제품군은 다양한 사용 사례에 맞게 최적화되어 있습니다. 다음 표에서 가장 인기있는 사용 사례 중 일부와 일치하는 VM 제품군을 찾을 수 있습니다.
형식 | 크기 | 설명 |
---|---|---|
항목 수준 | Av2 |
개발과 테스트 등 항목별 작업에 가장 적합한 CPU 성능 및 메모리 구성을 갖추고 있습니다. 경제적이고 Azure를 시작하기 위한 저렴한 옵션을 제공합니다. |
범용 | CPU 대 메모리 비율이 적당합니다. 테스트 및 개발, 중소 규모 데이터베이스 및 트래픽이 적거나 중간 정도인 웹 서버에 적합합니다. | |
컴퓨팅 최적화 | F |
CPU 대 메모리 비율이 높습니다. 트래픽이 중간 정도인 웹 서버, 네트워크 어플라이언스, 일괄 처리 프로세스 및 애플리케이션 서버에 적합합니다. |
메모리에 최적화 | Esv3 : Ev3 |
메모리 대 CPU 비율이 높습니다. 관계형 데이터베이스 서버, 중대형 캐시 및 메모리 내 분석에 적합합니다. |
- HDInsight 지원 지역에서 사용 가능한 VM 인스턴스의 가격 책정에 대한 자세한 내용은 HDInsight 가격 책정을 참조하세요.
가벼운 워크로드에 대한 비용 절감 VM 유형
처리 요구 사항이 적은 경우 F 시리즈는 HDInsight를 시작하는데 적합합니다. 시간당 가격이 더 낮은 F 시리즈는 vCPU당 ACU(Azure 컴퓨팅 단위)를 기준으로 하는 Azure 포트폴리오에서 가격 대비 성능이 가장 좋습니다.
다음 표에서는 Fsv2 시리즈 VM을 사용하여 만들 수 있는 클러스터 유형 및 노드 유형을 설명합니다.
클러스터 유형 | 버전 | 작업자 노드 | 헤드 노드 | Zookeeper 노드 |
---|---|---|---|---|
Spark | 모두 | F4 이상 | 아니요 | 아니요 |
Hadoop은 | 모두 | F4 이상 | 아니요 | 아니요 |
Kafka | 모두 | F4 이상 | 아니요 | 아니요 |
HBase | 모두 | F4 이상 | 아니요 | 아니요 |
LLAP | disabled | 아니요 | 아니요 | 아니요 |
각 F 시리즈 SKU의 사양을 보려면 F 시리즈 VM 크기를 참조하세요.
벤치마킹
벤치마킹은 다른 VM에서 시뮬레이션된 워크로드를 실행하여 프로덕션 워크로드에 얼마나 잘 수행되는지 측정하는 프로세스입니다.
VM SkU 및 클러스터 크기에 대한 벤치마킹에 대한 자세한 내용은 Azure HDInsight의 클러스터 용량 계획을 참조하세요.