매핑 데이터 흐름 변환 개요
적용 대상: Azure Data Factory Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!
데이터 흐름은 Azure Data Factory 및 Azure Synapse Pipelines 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 처음 사용하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.
다음은 현재 매핑 데이터 흐름에서 지원되는 변환 목록입니다. 각 변환을 클릭하여 구성 세부 정보를 알아보세요.
이름 | 범주 | 설명 |
---|---|---|
집계 | 스키마 한정자 | 기존 열 또는 계산 열로 그룹화된 SUM, MIN, MAX, COUNT와 같은 다양한 유형의 집계를 정의합니다. |
행 변경 | 행 한정자 | 행에 대한 삽입, 삭제, 업데이트 및 upsert 정책을 설정합니다. |
Assert | 행 한정자 | 각 행에 대한 어설션 규칙을 설정합니다. |
캐스트 | 스키마 한정자 | 형식 검사를 사용하여 열 데이터 형식을 변경합니다. |
조건부 분할 | 다중 입력/출력 | 일치 조건에 따라 데이터 행을 서로 다른 스트림으로 라우팅합니다. |
파생 열 | 스키마 한정자 | 데이터 흐름 식 언어를 사용하여 새 열을 생성하거나 기존 필드를 수정합니다. |
외부 호출 | 스키마 한정자 | 외부 엔드포인트를 행 단위로 인라인으로 호출합니다. |
Exists | 다중 입력/출력 | 데이터가 다른 원본 또는 스트림에 있는지 확인합니다. |
Filter | 행 한정자 | 조건에 따라 행을 필터링합니다. |
평면화(flatten) | 포맷터 | JSON과 같은 계층 구조 내부의 배열 값을 가져와서 개별 행으로 언롤합니다. |
Flowlet | Flowlet | 다시 사용할 수 있는 사용자 지정 변환 논리를 빌드하고 포함합니다. |
Join | 다중 입력/출력 | 두 원본 또는 스트림의 데이터를 결합합니다. |
조회 | 다중 입력/출력 | 다른 원본에서 데이터를 참조합니다. |
새 분기 | 다중 입력/출력 | 동일한 데이터 스트림에 대해 여러 작업 및 변환 세트를 적용합니다. |
Parse | 포맷터 | 데이터 스트림에서 JSON, 구분된 텍스트, 또는 XML 형식 텍스트의 문자열인 텍스트 열을 구문 분석합니다. |
피벗 | 스키마 한정자 | 하나 이상의 그룹화 열이 개별 열로 변환된 고유한 행 값을 갖는 집계입니다. |
Rank | 스키마 한정자 | 정렬 조건을 기준으로 정렬된 순위를 생성합니다. |
선택 | 스키마 한정자 | 열 및 스트림 이름의 별칭을 지정하고, 열을 삭제하거나 다시 정렬합니다. |
싱크 | - | 데이터의 최종 대상입니다. |
Sort | 행 한정자 | 현재 데이터 스트림에서 들어오는 행을 정렬합니다. |
Source | - | 데이터 흐름에 대한 데이터 원본입니다. |
문자열 변환 | 포맷터 | 복합 형식을 일반 문자열로 변환 |
서로게이트 키 | 스키마 한정자 | 증가하는 업무 외 임의 키 값을 추가합니다. |
Union | 다중 입력/출력 | 여러 데이터 스트림을 수직으로 결합합니다. |
피벗 해제 | 스키마 한정자 | 열을 행 값으로 피벗합니다. |
창 | 스키마 한정자 | 데이터 스트림에서 창 기반 열 집계를 정의합니다. |