다음을 통해 공유


분석 플랫폼 시스템에 대한 서버 용량 계획 워크시트 로드

이 용량 계획 워크시트는 SQL Server PDW에 데이터를 로드하기 위한 로드 서버의 요구 사항을 결정하는 데 도움이 됩니다. 이를 사용하여 기존 로딩 서버를 구매하거나 프로비전하기 위한 계획을 만듭니다.

워크시트 노트

  1. 이 워크시트는 dwloader 명령줄 로드 도구를 사용하여 데이터를 로드하는 서버에 적용됩니다.

  2. Integration Services 또는 타사 로드 도구를 사용하여 데이터를 로드하는 경우 요구 사항은 로드 프로세스의 차이점에 따라 달라질 수 있습니다.

  3. 대부분의 요구 사항은 압축되거나 압축되지 않은 데이터 파일을 로드하는 데 적용됩니다. 요구 사항의 차이는 굵게 표시됩니다.

Clipboard 용량 계획 워크시트

이 워크시트를 인쇄하고 사용자 고유의 요구 사항으로 채웁니다.

구성 요소 요구 사항 이 열을 사용자 고유의 요구 사항으로 채웁니다. 추천
저장소 지정된 기간 동안 로드 서버에 저장할 최대 바이트 수입니다. Pencil icon 스토리지 요구 사항을 확인하려면 지정된 기간 동안 로드 서버에 저장할 데이터의 양을 파악합니다. 용량 요구 사항은 로드 파일에만 해당합니다. 운영 체제 및 로드 파일은 서로 다른 디스크 배열에 있어야 합니다.

예를 들어 매일 3번 디스크에서 100GB의 데이터를 로드하지만 주말까지 데이터 파일을 삭제하지 않으려면 데이터 파일을 저장하려면 최소 2.1TB가 필요합니다. 분산 및 증가를 고려하려면 보수적이고 약 30% 더 많은 스토리지를 가져오는 것이 좋습니다. 이 예제에서는 2.73TB의 스토리지 공간이 더 좋습니다.
부하 속도 PDW에 로드할 데이터의 시간당 최대 바이트 수입니다. Pencil icon 이는 예상 비용입니다. 이 요구 사항을 계산할 때 파일이 이미 로딩 서버에 있고 다른 로드 조건이 가능한 한 양선이라고 가정합니다.

예를 들어 dwloader는 항상 압축되지 않은 데이터를 PDW로 보내기 때문에 데이터 압축을 고려할 필요가 없습니다. 데이터 형식 변환 및 대상 테이블의 크기를 고려할 필요가 없습니다.
네트워크 네트워크 연결 유형입니다. Pencil icon 부하 속도 요구 사항에 가장 적합한 네트워크 연결 유형을 결정합니다.

예를 들어 InfiniBand 또는 10Gbit 이더넷은 최적의 로드 속도를 제공합니다. 1Gbit 이더넷은 로드 속도를 시간당 360GB 이하로 제한합니다.
I/O 읽기 및 쓰기에 대한 시간당 바이트입니다. Pencil icon 데이터를 로드하려면 dwloader가 PDW로 보내기 전에 디스크에서 모든 데이터를 읽어야 합니다.

각 로드 서버는 어플라이언스가 모든 로드 원본에서 데이터를 수신할 수 있는 것보다 빠르게 데이터를 로드할 수 없습니다. 비용을 절약하려면 어플라이언스의 부하 용량을 초과하지 않도록 로드할 I/O 읽기 용량을 계획합니다.

예:
PDW는 시간당 최대 1.8TB 속도로 데이터를 수신하고 1랙 어플라이언스에 로드합니다. 랙이 2개 이상인 어플라이언스의 경우 최대 로드 속도는 시간당 3.6TB입니다.

여러 로드 서버에서 동시에 로드하려는 경우 각 로드 서버에 대한 I/O 요구 사항은 한 서버가 모든 로드를 수행하는 경우보다 작습니다.

예를 들어 하나의 로딩 서버는 1랙 어플라이언스의 경우 시간당 최대 1.8TB를 로드할 수 있습니다. 두 개의 로드 서버는 각각 시간당 900GB를 1랙 어플라이언스로 동시에 로드할 수 있습니다. 동시성 수준이 높을수록 효율성과 최대 처리량을 줄일 수 있습니다.

I/O 용량의 경우 로드 서버에서 발생하는 모든 I/O를 고려합니다. 로드 서버에 ETL 서버에서 데이터 파일 수신과 같은 데이터 로드 외에 다른 I/O 트래픽이 있는 경우 I/O 요구 사항이 증가합니다.

압축된 데이터의 경우 I/O 요구 사항은 데이터 압축 속도에 따라 달라집니다. dwloader는 압축된 데이터를 읽은 다음 압축을 풀고 PDW로 보냅니다. 압축 비율이 높을수록 로드 서버가 디스크에서 읽어야 하는 데이터가 줄어듭니다.

예를 들어 필요한 로드 속도가 시간당 1.8TB이고 데이터가 2:1 압축으로 로드 서버에 저장되는 경우 로드 서버는 1.8TB가 아닌 디스크에서 시간당 900GB만 읽어야 합니다. 3:1 압축 비율은 로드 서버가 디스크에서 시간당 600GB를 읽어야 한다는 것을 의미합니다.
CPU 소켓 수입니다. Pencil icon 압축되지 않은 데이터를 로드하는 경우 dwloader는 CPU를 많이 사용하는 애플리케이션이 아닙니다. 최소 요구 사항으로 최근에 제조된 2 소켓 서버를 사용하는 것이 좋습니다.

압축된 데이터를 로드하려면 데이터를 PDW로 보내기 전에 압축을 풀기에 충분한 CPU 전원이 필요합니다. dwloader는 한 번에 10개의 활성 스레드를 실행할 수 있습니다. 압축된 파일을 동시에 10개 로드하려는 경우 서버에 10코어 CPU 또는 6코어 CPU 2개 이상을 사용하는 것이 좋습니다.
RAM Windows에서 로드하는 동안 파일을 캐시할 수 있는 메모리 GB입니다. Pencil icon dwloader는 로드 서버에서 RAM을 거의 사용하지 않습니다. 성능을 위해 Windows는 메모리를 사용하여 디스크에서 읽은 후 로드 파일을 캐시합니다.

RAM 요구 사항을 확인하려면 Windows Server 설치 및 타사 애플리케이션 요구 사항을 참조하세요. 다른 원본의 요구 사항이 없는 경우 최소 32GB를 사용하는 것이 좋습니다.

압축된 데이터의 경우 압축 해제 속도가 빨라지므로 더 빠른 RAM이 유용합니다.

참고 항목

로드 서버dwloader 명령줄 로더 획득 및 구성