매핑 데이터 흐름의 조건부 분할 변환
적용 대상: Azure Data Factory Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!
데이터 흐름은 Azure Data Factory 및 Azure Synapse Pipelines 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 처음 사용하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.
조건부 분할 변환은 일치 조건에 따라 데이터 행을 서로 다른 스트림으로 라우팅합니다. 조건부 분할 변환은 프로그래밍 언어의 CASE 결정 구조체와 비슷합니다. 변환은 식을 평가하고, 결과에 따라 데이터 행을 지정된 스트림으로 보냅니다.
구성
분할 설정은 데이터의 행이 첫 번째 일치하는 스트림으로 흐를지 또는 일치하는 모든 스트림으로 흐를지를 결정합니다.
데이터 흐름 식 작성기를 사용하여 분할 조건에 대한 식을 입력합니다. 새 조건을 추가하려면 기존 행에서 더하기 아이콘을 클릭합니다. 어떤 조건에도 일치하지 않는 행에도 기본 스트림을 추가할 수 있습니다.
데이터 흐름 스크립트
구문
<incomingStream>
split(
<conditionalExpression1>
<conditionalExpression2>
...
disjoint: {true | false}
) ~> <splitTx>@(stream1, stream2, ..., <defaultStream>)
예시
아래 예제는 들어오는 스트림 CleanData
를 사용하는 SplitByYear
라는 조건부 분할 변환입니다. 이 변환에는 두 개의 분할 조건 year < 1960
및 year > 1980
이 있습니다. disjoint
는 데이터가 일치하는 모든 조건이 아닌 첫 번째 일치 조건으로 이동하기 때문에 false입니다. 첫 번째 조건과 일치하는 모든 행이 출력 스트림 moviesBefore1960
으로 이동합니다. 두 번째 조건과 일치하는 나머지 행은 모두 출력 스트림 moviesAFter1980
으로 이동합니다. 다른 모든 행은 기본 스트림 AllOtherMovies
를 통해 흐릅니다.
서비스 UI에서 이 변환은 아래 이미지와 같습니다.
이 변환에 대한 데이터 흐름 스크립트는 아래 코드 조각에 있습니다.
CleanData
split(
year < 1960,
year > 1980,
disjoint: false
) ~> SplitByYear@(moviesBefore1960, moviesAfter1980, AllOtherMovies)