1단원: SSIS(SQL Server Integration Services)를 사용하여 프로젝트 및 기본 패키지 만들기
적용 대상: Azure Data Factory의 SQL Server SSIS Integration Runtime
이 단원에서는 간단한 ETL(추출, 변환 및 로드) 패키지를 만듭니다. 패키지는 단일 플랫 파일 원본에서 데이터를 추출하고, 두 가지 조회 변환을 사용하여 데이터를 변환하고, 변환된 데이터를 AdventureWorksDW2022
샘플 데이터베이스의 FactCurrencyRate 팩트 테이블 복사본에 씁니다. 이 단원에서는 새 패키지를 만들고, 데이터 원본 및 대상 연결을 추가 및 구성하고, 새 제어 흐름 및 데이터 흐름 구성 요소를 사용하는 방법을 알아봅니다.
패키지를 만들기 전에 원본 데이터와 대상 양쪽에 사용되는 형식을 알아야 합니다. 그런 다음 원본 데이터를 대상에 매핑하는 데 필요한 변환을 정의할 준비가 된 것입니다.
필수 조건
이 자습서에서는 Microsoft SQL Server Data Tools, 예제 패키지 집합 및 샘플 데이터베이스를 사용합니다.
SQL Server Data Tools를 설치하려면 SQL Server Data Tools 다운로드를 참조하세요.
이 자습서의 모든 단원 패키지를 다운로드하려면 다음을 수행합니다.
Integration Services 자습서 파일로 이동합니다.
다운로드 버튼을 선택합니다.
간단한 ETL Package.zip 파일 만들기를 선택한 다음, 다음을 선택합니다.
파일이 다운로드되면 해당 콘텐츠의 압축을 로컬 디렉터리에 압축 해제합니다.
샘플 데이터베이스를
AdventureWorksDW2022
설치하고 배포하려면 AdventureWorks 샘플 데이터베이스 설치 및 구성 - SQL을 참조하세요.
원본 데이터 보기
이 자습서에서 원본 데이터는 SampleCurrencyData.txt라는 플랫 파일의 기록 통화 데이터 세트입니다. 원본 데이터에는 통화의 평균 속도, 통화 키, 날짜 키 및 종료 날짜 비율의 네 개의 열이 있습니다.
다음은 SampleCurrencyData.txt 파일의 원본 데이터의 예입니다.
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
플랫 파일 원본 데이터로 작업할 때 플랫 파일 연결 관리자가 플랫 파일 데이터를 해석하는 방법을 이해하는 것이 중요합니다. 플랫 파일 원본이 유니코드인 경우 플랫 파일 연결 관리자는 모든 열을 기본 열 너비가 50인 [DT_WSTR]로 정의합니다. 플랫 파일 원본이 ANSI로 인코딩된 경우 기본 열 너비 50인 [DT_STR]로 정의합니다. 데이터에 문자열 열 형식을 더 적용할 수 있도록 이러한 기본값을 변경해야 할 수 있습니다. 대상의 데이터 형식을 확인한 다음 플랫 파일 연결 관리자에서 형식을 선택해야 합니다.
대상 데이터 확인
원본 데이터의 궁극적인 대상은 AdventureWorksDW2022
의 FactCurrencyRate 팩트 테이블 사본입니다. 다음 표와 같이 FactCurrencyRate 팩트 테이블에는 4개의 열이 있으며 두 차원 테이블에 대한 관계가 있습니다.
열 이름 | 데이터 형식 | 조회 테이블 | 조회 열 |
---|---|---|---|
AverageRate |
float |
None | None |
CurrencyKey |
int , , |
DimCurrency |
CurrencyKey , , |
DateKey |
int , , |
DimDate |
DateKey , , |
EndOfDayRate |
float |
None | None |
원본 데이터를 대상에 매핑
원본 및 대상 데이터 형식의 분석에는 CurrencyKey 및 DateKey 값에 대한 조회가 필요함을 나타냅니다. 이러한 조회를 수행하는 변환은 DimCurrency 및 DimDate 차원 테이블의 대체 키를 사용하여 해당 값을 가져옵니다.
플랫 파일 열 | 테이블 이름 | 열 이름 | 데이터 형식 |
---|---|---|---|
0 | FactCurrencyRate |
AverageRate |
float |
1 | DimCurrency |
CurrencyAlternateKey |
nchar(3) |
2 | DimDate |
FullDateAlternateKey |
date |
3 | FactCurrencyRate |
EndOfDayRate |
float |
단원 태스크
이 문서에 포함된 작업은 다음과 같습니다.