도메인 속성 설정
적용 대상: SQL Server
이 항목에서는 DQS(Data Quality Services)에서 도메인 속성을 설정하는 방법을 설명합니다.
시작하기 전에
필수 조건
도메인에 대한 속성을 설정하려면 기술 자료 및 도메인을 만들어야 합니다.
보안
사용 권한
도메인에서 속성을 설정하려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.
도메인 속성 설정
도메인 관리 작업에서 기술 자료를 열고(기술 자료 열기 참조) 도메인 목록에서 적절한 도메인을 선택하여 기존 도메인에 대한 속성을 설정합니다. 도메인 속성 페이지는 기본적으로 표시됩니다.
도메인 만들기에 설명된 대로 새 도메인을 만든 후 새 도메인에 속성을 설정합니다.
마침 을 클릭하여 도메인 관리 작업 종료에 설명된 대로 도메인 관리 작업을 완료합니다.
후속 작업: 도메인 속성을 설정한 후
도메인 속성을 설정한 후 도메인에 대해 다른 도메인 관리 태스크를 수행하거나, 기술 자료 검색을 수행하여 도메인에 정보를 추가하거나, 도메인에 일치 정책을 추가할 수 있습니다. 자세한 내용은 기술 자료 검색 수행, 도메인 관리 또는 일치 정책 만들기를 참조하세요.
도메인 속성
도메인 이름 및 설명
도메인이 만들어지면 도메인 이름 또는 설명을 변경할 수 있습니다. 도메인 이름은 기술 자료에 대해 고유해야 합니다. 설명은 최대 256자까지 지정할 수 있습니다.
데이터 형식
도메인을 만들 때 도메인의 값에 대해 다음 데이터 형식 중 하나를 선택합니다. String(기본값), Date, Integer 또는 Decimal 도메인을 만든 후에는 데이터 형식을 볼 수 있지만 변경할 수는 없습니다. 도메인에 대해 선택한 데이터 형식에 따라 도메인에 매핑할 수 있는 원본 데이터가 정의됩니다. DQS의 4개 도메인 데이터 형식 각각에 대해 지원되는 데이터 형식에 대한 자세한 내용은 DQS 도메인에 대해 지원되는 SQL Server 및 SSIS 데이터 형식을 참조하세요.
선행 값 사용
동의어 그룹의 선행 값이 동의어인 값 대신 출력되도록 지정하려면 이 확인란을 선택합니다. 선행 값 사용을 선택 취소하여 각 동의어 값이 올바르거나 수정된 형식으로 출력되고 해당 그룹의 선행 값으로 대체되지 않도록 지정합니다.
문자열 정규화
데이터 형식이 String인 경우 DQS에서 데이터 품질 처리를 위해 원본 데이터의 특수 문자를 무시하려면 클릭합니다. DQS는 날짜가 도메인에 로드될 때 내부적으로 특수 문자를 null 또는 공백으로 바꿉니다. 콜론, 하이픈, 마침표, 큰따옴표 또는 세미콜론이 공백으로 바뀝니다. 작은따옴표는 null로 바뀝니다. null을 사용하면 문자열의 두 부분이 함께 표시됩니다.
문자열 값에서 특수 문자를 무시하면 일치 정확도가 높아질 수 있습니다. 특수 문자를 null 또는 공백으로 바꿔 두 문자열 간의 유사성 점수를 늘릴 수 있습니다. 문장 부호 또는 다른 기호는 여러 문자열에서 서로 다를 가능성이 높습니다. 특수 문자를 내부적으로 교체하면 점수가 DQS의 최소 일치 임계값을 초과할 수 있으므로 두 문자열이 일치하지 않았을 때 일치하는 것으로 간주될 수 있습니다. 그러나 일치 작업을 수행할 데이터 형식에 따라 특수 문자를 무시하도록 선택할지 여부를 결정해야 합니다. 예를 들어 영어 측정 시스템에서 데이터를 사용하는 경우 제품 데이터에서 큰따옴표와 작은따옴표를 무시하면 큰따옴표가 인치를 나타내고 작은따옴표가 피트를 나타내는 경우 가양성이 발생할 수 있습니다.
검색, 일치 정책, 일치 프로젝트 및 정리 프로젝트 작업의 데이터 처리 단계에서 데이터가 로드되고 인덱싱될 때 정규화가 수행됩니다. 활성화된 경우 정규화 및 용어 기반 관계 변환은 모두 분석 전에 사전 처리 단계에서 수행됩니다. 문자열 간의 유사성을 컴퓨팅하는 알고리즘이 적용되기 전에 각 도메인에 대해 실행됩니다. 복합 도메인 구문 분석이 요청된 경우 구분 기호 구문 분석 시 기호가 필요하므로 이 작업이 정규화 및 용어 기반 관계 변환보다 먼저 수행됩니다. 도메인 규칙 및 도메인 값 변경과 같은 다른 작업은 변환 후에 수행됩니다. 결과 데이터는 DQS에서 특수 문자를 내부적으로 대체하여 변경되지 않습니다.
출력 형식
도메인의 데이터 값이 출력될 때 적용할 서식을 선택합니다. 서식은 다음 목록에 표시된 것처럼 선택한 데이터 형식에 따라 달라집니다. 없음을 선택하면 목록에 있는 형식이 적용되지 않습니다.
문자열 값의 경우 문자열을 대문자, 소문자 또는 대문자로 출력되도록 지정할 수 있습니다.
날짜 값의 경우 일, 월 및 연도의 형식을 지정할 수 있습니다.
정수 값의 경우 적용할 서식 마스크의 유형을 지정할 수 있습니다.
10진수 값의 경우 적용할 서식 마스크의 유형과 정확도를 지정할 수 있습니다.
언어
데이터 형식이 String인 경우 맞춤법 검사기 작업을 위해 도메인을 연결할 언어를 선택합니다. 맞춤법 검사기 결과는 사용 중인 언어에 따라 달라지므로 이 선택은 맞춤법 검사기에만 적용됩니다. 선택 영역은 데이터 형식이 문자열인 단일 도메인에만 적용됩니다. 언어 속성은 복합 도메인과는 관련이 없습니다. 복합 도메인에서 각 부분의 언어는 관련 단일 도메인에 의해 결정됩니다.
기본 언어는 한국어(Korean)입니다. Language 속성을 Other로 설정하면 도메인에 대한 맞춤법 검사기가 비활성화됩니다.
팁
언어가 Language 드롭다운 목록에 나열되지 않은 경우 Other를 선택해야 합니다. 이렇게 하면 DQS가 도메인에서 사용 가능한 지식(도메인 규칙, 도메인 값, TBR, 일치 규칙)에 따라 나열되지 않은 언어 데이터에 대한 중복 항목을 정리하고 제거합니다.
맞춤법 검사기 사용
데이터 형식이 String인 경우 클릭하여 도메인에 대해 DQS 맞춤법 검사기를 사용하도록 설정합니다. 맞춤법 검사기는 문자열 데이터 형식인 도메인에 대해서만 작동합니다. 맞춤법 검사기 사용 확인란을 사용하면 확인란과 연결된 단일 도메인에 대해서만 맞춤법 검사기를 사용할 수 있습니다. 복합 도메인에는 이 확인란이 적용되지 않습니다.
맞춤법 검사기는 도메인의 값에 대한 구문 및 유효성 검사 수정을 제안합니다. 자세한 내용은 DQS 맞춤법 검사기 사용을 참조하세요.
구문 오류 알고리즘 해제
데이터 형식이 문자열인 경우 정리 작업 시 DQS에서 도메인의 구문 오류를 식별하지 않도록 지정하려면 선택합니다. 해당 도메인에 대한 구문 오류가 관련이 없는지 식별할 때 이 확인란을 선택합니다. 예를 들어 구문 오류를 식별하는 것은 일련 번호에 중요하지 않을 수 있습니다. 이 컨트롤은 문자열 데이터 형식에 대해서만 사용할 수 있습니다. DQS는 문자열이 아닌 데이터 형식에서 구문 오류를 확인하지 않습니다.