다음을 통해 공유


병렬 데이터 웨어하우스에 데이터 로드

Integration Services, bcp 유틸리티, dwloader 명령줄 로더 또는 SQL INSERT 문을 사용하여 데이터를 로드하거나 SQL Server PDW(병렬 데이터 웨어하우스)에 삽입할 수 있습니다.

환경 로드

데이터를 로드하려면 하나 이상의 로드 서버가 필요합니다. 사용자 고유의 기존 ETL 또는 다른 서버를 사용하거나 새 서버를 구입할 수 있습니다. 자세한 내용은 로드 서버 획득 및 구성을 참조 하세요. 이러한 지침에는 로드에 적합한 솔루션을 계획하는 데 도움이 되는 로드 서버 용량 계획 워크시트가 포함됩니다.

dwloader를 사용하여 로드

dwloader 명령줄 로더를 사용하는 것이 PDW에 데이터를 로드하는 가장 빠른 방법입니다.

Loading process

dwloader는 제어 노드를 통해 데이터를 전달하지 않고 컴퓨팅 노드에 직접 데이터를 로드합니다. 데이터를 로드하기 위해 dwloader는 먼저 Control 노드와 통신하여 컴퓨팅 노드에 대한 연락처 정보를 가져옵니다. dwloader는 각 컴퓨팅 노드와 통신 채널을 설정한 다음 라운드 로빈 방식으로 256KB의 데이터 청크를 컴퓨팅 노드로 보냅니다.

각 컴퓨팅 노드에서 DMS(데이터 이동 서비스)는 데이터 청크를 수신하고 처리합니다. 데이터 처리에는 각 행을 SQL Server 네이티브 형식으로 변환하고 배포 해시를 컴퓨팅하여 각 행이 속한 컴퓨팅 노드를 결정하는 작업이 포함됩니다.

행을 처리한 후 DMS는 순서 섞기 이동을 사용하여 각 행을 올바른 컴퓨팅 노드 및 SQL Server 인스턴스로 전송합니다. SQL Server는 행을 받으면 dwloader에 설정된 -b 일괄 처리 크기 매개 변수에 따라 일괄 처리한 다음 일괄 처리를 대량 로드합니다.

준비된 문을 사용하여 로드

준비된 문을 사용하여 분산 및 복제된 테이블에 데이터를 로드할 수 있습니다. 입력 데이터가 대상 데이터 형식과 일치하지 않으면 암시적 변환이 수행됩니다. PDW 준비 문에서 지원하는 암시적 변환은 SQL Server에서 지원하는 변환의 하위 집합입니다. 즉, 변환의 하위 집합만 지원되지만 지원되는 변환은 SQL Server 암시적 변환과 일치합니다. 로드할 대상 테이블이 분산 또는 복제 테이블로 정의되었는지 여부에 관계없이 대상 테이블에 있는 모든 열에 암시적 변환이 적용됩니다(필요한 경우).

Task 설명
스테이징 데이터베이스를 만듭니다. 스테이징 데이터베이스 만들기
Integration Services를 사용하여 로드합니다. Integration Services를 사용하여 로드
dwloader의 형식 변환을 이해합니다. dwloader의 데이터 형식 변환 규칙
dwloader를 사용하여 데이터를 로드합니다. dwloader 명령줄 로더
INSERT의 형식 변환을 이해합니다. INSERT를 사용하여 데이터 로드