복합 도메인 만들기
적용 대상: SQL Server
이 항목에서는 DQS(Data Quality Services)의 기술 자료에서 복합 도메인을 만드는 방법을 설명합니다. 복합 도메인은 단일 데이터 필드에 적용되는 하나 이상의 단일 도메인으로 구성됩니다. 복합 도메인에 대한 자세한 내용은 복합 도메인 관리를 참조하세요.
새 복합 도메인을 만드는 방법에는 두 가지가 있습니다. 첫 번째는 새 기술 자료 또는 기존 기술 자료에 정보를 추가할 데이터 샘플을 분석하는 기술 자료 검색 작업의 매핑 단계에서 만드는 방법입니다. 두 번째는 도메인 관리 작업에서 기존 도메인을 변경하는 대신 새 도메인을 만드는 방법입니다. 복합 도메인을 만들려면 복합 도메인에 추가할 단일 도메인을 두 개 이상 이미 만들었어야 합니다. 새 복합 도메인을 만들 때 이미 만들어지고 기존 복합 도메인에 추가되지 않은 단일 도메인만 사용할 수 있습니다. 단일 도메인을 둘 이상의 복합 도메인에 추가할 수 없으며, 복합 도메인을 다른 복합 도메인에 추가할 수 없습니다.
복합 도메인을 만든 후 복합 도메인의 속성을 변경하거나 참조 데이터 서비스를 도메인에 연결하거나 도메인 간 규칙을 만들거나 값 관계를 만들 수 있습니다. 이렇게 하려면 도메인 관리 페이지의 도메인 목록에서 복합 도메인을 선택하고 적절한 탭을 선택합니다.
시작하기 전에
필수 조건
복합 도메인을 만들려면 기술 자료를 만들고 열어야 하며 복합 도메인에 추가할 단일 도메인을 두 개 이상 만들어야 합니다.
보안
사용 권한
복합 도메인을 만들려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.
지식 검색 작업에서 복합 도메인 만들기
Data Quality Client를 시작합니다. 이 작업에 대한 자세한 내용은 Data Quality Client 애플리케이션 실행을 참조하세요.
Data Quality Client 홈 화면에서 기술 자료 열기를 클릭한 다음, 기술 자료를 선택하거나 새 기술 자료를 클릭하고 새 기술 자료의 속성을 입력합니다.
지식 검색을 작업으로 선택한 다음, 만들기를 클릭하여 새 기술 자료를 만들거나 열기를 클릭하여 기존 기술 자료를 엽니다.
맵 페이지에서 데이터 원본에 대한 연결을 지정합니다. 자세한 내용은 지식 검색 수행을 참조하세요.
매핑 테이블에서 빈 행의 원본 열 에 대한 드롭다운 목록에서 원본 열을 선택합니다. 원본 열에 두 개의 기존 단일 도메인에 의해 주소가 지정된 복합 도메인이 포함되어 있는지 확인합니다. 해당하는 단일 도메인이 없으면 도메인 만들기 아이콘을 클릭합니다.
매핑 테이블에서 빈 행의 원본 열 에 대한 드롭다운 목록에서 원본 열을 선택합니다. 원본 열에 두 개의 기존 단일 도메인에 의해 주소가 지정된 복합 도메인 부분이 포함되어 있는지 확인합니다. 해당하는 단일 도메인이 없으면 도메인 만들기 아이콘을 클릭하여 도메인을 만듭니다. 자세한 내용은 도메인 만들기을 참조하세요.
복합 도메인 만들기 아이콘을 클릭합니다.
도메인 관리 작업에서 복합 도메인 만들기
Data Quality Services 클라이언트 홈 페이지에서 기술 자료 열기 를 클릭한 다음 기술 자료를 선택하거나 새 기술 자료 를 클릭하고 새 기술 자료의 속성을 입력합니다.
도메인 관리를 작업으로 선택한 다음, 만들기를 클릭하여 새 기술 자료를 만들거나 열기를 클릭하여 기존 기술 자료를 엽니다.
복합 도메인에 필요한 두 개 이상의 단일 도메인이 있는지 확인합니다. 필요한 단일 도메인이 없으면 도메인 만들기 아이콘을 클릭하여 단일 도메인을 만듭니다. 자세한 내용은 도메인 만들기을 참조하세요.
도메인 관리 페이지에서 도메인 목록 위의 복합 도메인 만들기 아이콘을 클릭합니다.
기술 자료에 대한 고유한 이름과 최대 256자의 설명을 입력합니다.
도메인 목록에서 복합 도메인의 일부가 될 도메인을 선택하고 오른쪽 화살표를 클릭하여 복합 도메인의 도메인 테이블로 이동합니다.
확인을 클릭합니다.
복합 도메인 속성 설정
복합 도메인 만들기 대화 상자에서 기술 자료에 대한 고유한 이름과 최대 256자의 설명을 입력합니다.
도메인 목록에서 복합 도메인의 일부가 될 도메인을 선택하고 오른쪽 화살표를 클릭하여 복합 도메인의 도메인 테이블로 이동합니다. 만드는 복합 도메인에 추가할 수 있는 단일 도메인 목록입니다. 이미 만들어지고 기존 복합 도메인에 추가되지 않은 단일 도메인만 사용할 수 있습니다. 단일 도메인을 기술 자료에 있는 둘 이상의 복합 도메인에 추가할 수 없으며, 복합 도메인을 다른 복합 도메인에 추가할 수 없습니다.
고급을 클릭합니다.
구문 분석 메서드에 대해 다음 중 하나를 선택합니다.
참조 데이터: RDS(참조 데이터 서비스)에 의해 데이터 형식이 지정된 방식에 따라 필드의 값을 구문 분석합니다. Data Quality Services는 복합 도메인의 값을 RDS로 보내고 RDS는 복합 도메인의 도메인에 따라 수정 및 구문 분석된 데이터를 반환합니다.
순서: 복합 도메인의 도메인 순서에 따라 필드의 값을 구문 분석합니다. 첫 번째 값은 첫 번째 도메인에 포함되고, 두 번째 값은 두 번째 도메인에 포함되는 방식으로 이루어집니다.
구분 기호: 구분 기호를 선택할 때 표시되는 라디오 단추에서 선택한 구분 기호에 따라 필드의 값을 구문 분석합니다. 구분 기호는 탭, 세미콜론, 쉼표, 공백또는 기타일 수 있습니다. 기타인 경우 구분 기호로 사용할 값을 입력합니다.
구문 분석 메서드에 대해 구분 기호를 선택한 경우 지식 기반 구문 분석 사용을 선택할 수도 있습니다. 자세한 내용은 지식 기반 구문 분석을 참조하세요.
마침 을 클릭하여 도메인 관리 작업 종료에 설명된 대로 도메인 관리 작업을 완료합니다.
후속 작업: 복합 도메인을 만든 후
복합 도메인을 만든 후 도메인에 대해 다른 도메인 관리 태스크를 수행하거나 지식 검색을 수행하여 도메인에 정보를 추가하거나 도메인에 일치 정책을 추가할 수 있습니다. 자세한 내용은 기술 자료 검색 수행, 도메인 관리 또는 일치 정책 만들기를 참조하세요.
지식 기반 구문 분석
Data Quality Services를 사용하면 구분 기호나 순서뿐 아니라 기술 자료를 기반으로 데이터를 구문 분석할 수 있습니다. 기술 자료 구문 분석은 복잡한 원본 데이터가 복합 도메인에 매핑되어 있고 참조 데이터 서비스를 사용하지 않는 경우에 사용됩니다. 지식 기반 구문 분석을 사용하여 데이터 원본의 데이터를 관련 단일 도메인으로 구문 분석할 수 있습니다. 지식 기반 구문 분석에서 DQS는 먼저 지식을 사용하여 복잡한 데이터를 단일 도메인으로 구문 분석하려고 시도합니다. 가능한 경우 문자열의 일부를 하나 이상의 도메인으로 식별하여 문자열을 여러 도메인으로 구문 분석합니다. 예를 들어 전체 이름 복합 도메인이 나타내는 전체 이름 필드에 복합 값으로 "John B. Doe"가 있다고 가정합니다. DQS가 이름 도메인에서와 같이 "John"을 식별하고 성 도메인에서와 같이 "Doe"를 식별하는 경우 DQS는 도메인 지식에 따라 중간 이름 도메인에 "B."를 추가합니다.
구분 기호 기반 구문 분석도 선택하는 경우에만 지식 기반 구문 분석을 사용할 수 있습니다. 지식 기반 구문 분석에서는 구분 기호 구문 분석을 대체하지 않지만 향상된 기능을 제공합니다. 이렇게 할 지식이 없는 경우에만 DQS는 구분 기호를 사용하여 구문 분석을 수행합니다. 경우에 따라 DQS에서 기술 자료 구문 분석으로 일부 구문 분석을 확인한 후 구분 기호 기반 구문 분석으로 다른 구문 분석을 확인할 수도 있습니다.
복합 도메인이 문자열 도메인으로 구성되거나 복합 도메인이 서로 다른 유형의 도메인(int, date, time 등)으로 구성된 경우 지식 기반 구문 분석을 사용할 수 있습니다. 데이터 원본이 여러 데이터 형식으로 구성된 경우에는 먼저 문자열이 아닌 데이터 형식에 대한 구문 분석이 수행된 후 위에 설명된 대로 도메인 기술 자료에 따라 데이터의 나머지 부분에 대한 구문 분석이 수행됩니다.
지식 기반 구문 분석을 사용하는 경우 원본 데이터에 복합 도메인의 도메인보다 적은 값이 있는 경우 DQS는 누락된 도메인에 null을 배치합니다. 원본 데이터에 복합 도메인의 도메인보다 더 많은 값이 있는 경우 DQS는 열 중 하나에 추가 데이터를 추가합니다. 둘 이상의 도메인에 같은 값이 포함된 경우 데이터 원본은 첫 번째 일치하는 도메인으로 구문 분석됩니다.