다음을 통해 공유


DQS 정리 변환

적용 대상: SQL Server Azure Data Factory의 SSIS Integration Runtime

DQS 정리 변환은 DQS(Data Quality Services)를 사용하여 연결된 데이터 원본 또는 유사한 데이터 원본에 대해 생성된 승인된 규칙을 적용하여 연결된 데이터 원본의 데이터를 수정합니다. 데이터 수정 규칙에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하십시오. DQS에 대한 자세한 내용은 Data Quality Services Concepts을 참조하십시오.

데이터를 수정해야 하는지 여부를 확인하기 위해 DQS 정리 변환은 다음 조건이 충족되면 입력 열의 데이터를 처리합니다.

  • 데이터 수정을 위해 열이 선택됩니다.

  • 열 데이터 형식은 데이터 수정에 대해 지원됩니다.

  • 열은 호환되는 데이터 형식을 가진 도메인에 매핑됩니다.

변환에는 행 수준 오류를 처리하도록 구성하는 오류 출력도 포함됩니다. 오류 출력을 구성하려면 DQS 정리 변환 편집기를 사용합니다.

유사 항목 그룹화 변환을 데이터 흐름에 포함하여 중복될 가능성이 있는 데이터 행을 식별할 수 있습니다.

데이터 품질 프로젝트 및 값

DQS 정리 변환으로 데이터를 처리하면 Data Quality 서버에 정리 프로젝트가 생성됩니다. Data Quality 클라이언트를 사용하여 프로젝트를 관리합니다. 또한 Data Quality 클라이언트를 사용하여 프로젝트 값을 DQS 기술 자료 도메인으로 가져올 수 있습니다. DQS 정리 변환이 사용하도록 구성된 도메인(또는 연결된 도메인)으로만 값을 가져올 수 있습니다.

DQS 정리 변환 편집기 대화 상자

DQS 정리 변환 편집기 대화 상자를 사용하여 DQS(Data Quality Services)를 사용하여 데이터를 수정합니다. 자세한 내용은 Data Quality Services Concepts을 참조하십시오.

수행 작업

DQS 정리 변환 편집기 열기

  1. SSDT(SQL Server Data Tools)에서 Integration Services 패키지에 DQS 정리 변환을 추가합니다.

  2. 구성 요소를 마우스 오른쪽 단추로 누른 편집합니다.

연결 관리자 탭에서 옵션 설정

데이터 품질 연결 관리자
목록에서 기존 DQS 연결 관리자를 선택하거나 새로 만들기를 클릭하여 새 연결을 만듭니다.

New
DQS 정리 연결 관리자 대화 상자를 사용하여 새 연결 관리자를 만듭니다. DQS 정리 연결 관리자 대화 상자에서 옵션 설정을 참조합니다.

데이터 품질 기술 자료
연결된 데이터 원본에 대한 기존 DQS 기술 자료를 선택합니다. DQS 기술 자료 대한 자세한 내용은 DQS 기술 자료 및 도메인을 참조하세요.

연결 암호화
DQS 서버와 Integration Services 사이의 데이터 전송을 암호화하기 위해 연결을 암호화할지 여부를 지정합니다.

사용 가능한 도메인
선택한 기술 자료에 사용 가능한 도메인을 나열합니다. 두 가지 유형의 도메인, 즉 단일 도메인과 둘 이상의 단일 도메인을 포함하는 복합 도메인이 있습니다.

열을 복합 도메인에 매핑하는 방법에 대한 자세한 내용은 복합 도메인에 열 매핑을 참조하세요.

도메인에 대한 자세한 내용은 DQS Knowledge Bases and Domains을 참조하십시오.

오류 출력 구성
행 수준 오류 처리 방법을 지정합니다. 변환에서 연결된 데이터 원본의 데이터를 수정할 때 예기치 않은 데이터 값 또는 유효성 검사 제약 조건으로 인해 오류가 발생할 수 있습니다.

유효한 값은 다음과 같습니다.

  • 오류 구성 요소- 변환이 실패하고 입력 데이터가 Data Quality Services 데이터베이스에 삽입되지 않음을 나타냅니다. 기본값입니다.

  • 입력 데이터가 Data Quality Services 데이터베이스에 삽입되지 않고 오류 출력으로 리디렉션됨을 나타내는 리디렉션 행입니다.

매핑 탭에서 옵션 설정

열을 복합 도메인에 매핑하는 방법에 대한 자세한 내용은 복합 도메인에 열 매핑을 참조하세요.

사용 가능한 입력 열
연결된 데이터 원본의 열을 나열합니다. 수정하려는 데이터가 포함된 열을 하나 이상 선택합니다.

입력 열
사용 가능한 입력 열 영역에서 선택한 입력 열을 나열합니다 .

도메인
입력 열에 매핑할 도메인을 선택합니다.

원본 별칭
원래 열 값이 포함된 원본 열을 나열합니다.

필드를 클릭하여 열 이름을 수정합니다.

출력 별칭
DQS 정리 변환을 통해 출력될 열을 나열합니다. 원래 열 값 또는 수정된 값이 들어 있는 열입니다.

필드를 클릭하여 열 이름을 수정합니다.

상태 별칭
수정된 데이터에 대한 상태 정보가 포함된 열을 나열합니다. 필드를 클릭하여 열 이름을 수정합니다.

고급 탭에서 옵션 설정

표준화된 출력
도메인에 대해 정의된 출력 형식을 기반으로 표준화된 형식으로 데이터를 출력할지 여부를 나타냅니다. 표준화된 형식에 대한 자세한 내용은 데이터 정리를 참조 하세요.

신뢰
수정된 데이터에 대한 신뢰 수준을 포함할지 여부를 나타냅니다. 신뢰 수준은 수정 또는 제안에 대한 DQS 확실성 범위를 나타냅니다. 신뢰 수준에 대한 자세한 내용은 데이터 정리를 참조하세요.

원인
데이터 수정 이유를 포함할지 여부를 나타냅니다.

데이터 추가
기존 참조 데이터 공급자로부터 받은 추가 데이터를 출력할지 여부를 나타냅니다. 자세한 내용은 Reference Data Services in DQS을 참조하세요.

추가된 데이터 스키마
데이터 스키마를 출력할지 여부를 나타냅니다. 자세한 내용은 참조 데이터에 도메인 또는 복합 도메인 연결을 참조하세요.

DQS 정리 연결 관리자 대화 상자에서 옵션 설정

서버 이름
연결할 DQS 서버의 이름을 선택하거나 입력합니다. 서버에 대한 자세한 내용은 DQS Administration을 참조하세요.

연결 테스트
지정한 연결이 표시되는지 확인하려면 클릭합니다.

다음을 수행하여 연결 영역에서 DQS 정리 연결 관리자 대화 상자를 열 수도 있습니다.

  1. SSDT(SQL Server Data Tools)에서 기존 Integration Services 프로젝트를 열거나 새 프로젝트를 만듭니다.

  2. 연결 영역을 마우스 오른쪽 단추로 클릭하고 새 연결을 클릭한 다음 DQS를 클릭합니다.

  3. 추가를 클릭합니다.