Data Quality Services 개념
적용 대상: SQL Server
이 항목에서는 지식 관리, 데이터 품질 프로젝트 및 데이터 품질 관리에 대한 DQS(Data Quality Services) 개념을 간략하게 요약합니다.
기술 자료 관리 개념
DQS 기술 자료는 데이터 관리자나 IT 전문가가 데이터 정리 및 데이터 일치를 통해 데이터 품질 향상을 위해 만든 메타데이터의 리포지토리입니다. DQS 기술 자료 관리에는 컴퓨터 기반은 물론 대화형으로도 기술 자료를 만들고 관리하는 데 사용되는 프로세스가 포함됩니다.
지식 검색
지식 검색은 조직의 데이터 샘플을 분석하여 데이터에 대한 지식을 빌드하는 컴퓨터 지원 프로세스입니다. 분석 결과가 있으면 지식의 유효성을 검사하고 향상시킨 다음, 이를 적용하여 데이터 정리, 일치 및 프로파일링을 수행할 수 있습니다. 자세한 내용은 DQS 기술 자료 및 도메인을 참조하세요.
도메인 관리
도메인 관리 프로세스를 사용하면 지식 검색 프로세스에서 생성된 지식을 변경하거나 보강할 수 있습니다. 기술 자료를 대화형으로 편집, 업데이트 및 검토할 수 있습니다. 기술 자료 도메인 값과 해당 상태, 도메인 규칙, 용어 기반 관계 및 참조 데이터를 포함하는 데이터 도메인으로 구성됩니다. 도메인 관리에서 도메인 속성을 변경하고, 참조 데이터를 도메인에 연결하며, 도메인 규칙을 관리하고, 도메인 값을 관리하며, 데이터 관계를 입력하고, 도메인 만들기, 삭제, 가져오기 또는 내보내기를 수행할 수 있습니다. 둘 이상의 단일 도메인을 집계하는 복합 도메인을 사용할 수도 있습니다. 자세한 내용은 DQS 기술 자료 및 도메인을 참조하세요.
일치 정책
일치 정책에는 데이터 중복 제거를 수행하는 데 사용되는 일치 규칙이 포함됩니다. 일치 정책 프로세스에서는 일치 규칙을 만들고, 일치 결과와 프로파일링 데이터를 기반으로 이 결과를 미세 조정하며, 정책을 기술 자료에 추가할 수 있습니다. 자세한 내용은 데이터 일치를 참조하세요.
참조 데이터 서비스
참조 데이터를 사용하여 데이터의 유효성을 검사하고, 수정하고, 보강할 수 있으며, 참조 데이터의 품질을 보장하는 회사의 서비스를 활용할 수 있습니다. Azure Marketplace의 서비스를 사용하여 참조 데이터 공급자에 연결하거나 공급자에 직접 연결할 수 있습니다. 자세한 내용은 Reference Data Services in DQS을 참조하세요.
DQS의 지식 관리에 대한 자세한 내용은 DQS 기술 자료 및 도메인을 참조하세요.
데이터 품질 프로젝트 개념
데이터 관리자는 Data Quality Client 애플리케이션에서 데이터 품질 프로젝트를 사용하여 데이터 품질 작업(정리 및 일치)을 수행합니다.
데이터 정리
DQS의 데이터 정리는 DQS 기술 자료 지식을 기반으로 하여 수행됩니다. DQS의 데이터 정리 작업은 다음과 같은 2단계 프로세스입니다.
컴퓨터 지원 정리: DQS는 정리 프로젝트에 대해 선택한 기술 자료 지식을 사용하여 데이터 원본의 값에 대한 수정/제안을 제안합니다.
대화형 정리: 데이터 관리자는 대화형 정리 프로세스를 수행하여 컴퓨터 지원 데이터 정리 프로세스에서 제안된 데이터 수정을 변경하거나 보강할 수 있습니다. 데이터 관리자는 데이터 정리 프로세스에서 식별된 신뢰 수준과 통계를 사용하거나 자체 변경 내용을 프로젝트에 수동으로 입력하여 이 작업을 수행합니다.
데이터 관리자는 데이터를 정리한 후 처리된 데이터를 SQL Server 데이터베이스, .csv 파일 또는 Excel 파일로 내보낼 수 있습니다. 자세한 내용은 데이터 정리를 참조하세요.
데이터 일치
일치 프로세스에서는 데이터 관리자가 데이터를 비교하여 중복 제거 프로세스를 통해 비슷하지만 약간 다른 데이터를 정렬할 수 있습니다. DQS는 기술 자료 포함된 일치 규칙에 따라 중복 제거를 수행합니다. 데이터 관리자는 데이터 품질 프로젝트 내에서 일치 프로세스에 대한 매개 변수를 지정합니다. 자세한 내용은 데이터 일치를 참조하세요.
프로파일링 및 알림
데이터 프로파일링은 데이터 품질 프로젝트를 실행하는 동안 정리 또는 일치 작업을 위해 DQS에서 처리하는 데이터에 대한 실시간 통계 및 정보를 데이터 관리자에게 제공합니다. 데이터 프로파일링은 데이터 품질 프로젝트에서 정리 및 일치 작업의 효과성을 평가하는 데 도움이 되며, 알림은 사용자가 데이터 정리 및 데이터 일치 작업을 향상시킬 수 있는 작업을 수행하는 데 도움이 됩니다. 자세한 내용은 DQS의 데이터 프로파일링 및 알림을 참조하세요.
DQS의 데이터 품질 프로젝트에 대한 자세한 내용은 DQS(데이터 품질 프로젝트)를 참조하세요.
데이터 품질 관리 개념
DQS 관리자는 Data Quality Client 애플리케이션을 사용하여 다양한 관리 작업을 수행할 수 있습니다.
작업 모니터링
작업 모니터링은 데이터 범위 내에서 수행되는 각 작업의 상태를 표시하고, 각 작업에 대한 데이터를 제공하며, DQS 관리자가 작업을 제어할 수 있도록 합니다. 자세한 내용은 Monitor DQS Activities을 참조하세요.
Configuration
[구성] 옵션을 사용하면 다음을 수행할 수 있습니다.
참조 데이터 서비스 설정을 구성합니다. 자세한 내용은 참조 데이터를 사용하도록 DQS 구성을 참조하세요.
정리 및 일치 작업에 대한 임계값 설정. 자세한 내용은 정리 및 일치에 대한 임계값 구성을 참조하세요.
프로파일링 알림을 사용하거나 사용하지 않도록 설정합니다. 자세한 내용은 DQS에서 프로파일링 알림 사용 또는 사용 안 함을 참조하세요.
작업 기반 수준 또는 고급 모듈 기반 수준에서 DQS 로그 파일에 대한 심각도 수준을 구성합니다. 자세한 내용은 DQS 로그 파일에 대한 심각도 수준 구성을 참조하세요.
DQS 보안
역할을 SQL Server 보안 메커니즘 내에서 사용하여 DQS를 안전하게 만듭니다. Data Quality Client 애플리케이션에서 사용자의 액세스 수준을 결정하는 세 가지 DQS 역할(dqs_administrator, dqs_kb_editor 및 dqs_kb_operator)이 있습니다. Data Quality Client 애플리케이션을 사용하여 사용자에게 역할을 부여할 수 없습니다. 이 작업은 SQL Server Management Studio를 사용하여 수행됩니다. 자세한 내용은 DQS 보안을 참조하세요.
DQS 관리에 대한 자세한 내용은 DQS 관리를 참조하세요.