데이터 카탈로그
데이터 카탈로그는 중앙 집중식 위치에서 데이터 정보를 등록하고 유지 관리하며 조직에서 사용할 수 있도록 합니다. 이를 통해 기업은 여러 프로젝트 팀의 중복 데이터 수집으로 인해 발생하는 중복 데이터 제품을 방지할 수 있습니다. 데이터 카탈로그 서비스를 만들어 데이터 랜딩 존에 저장된 데이터 제품의 메타데이터를 정의하는 것이 좋습니다.
클라우드 규모 분석은 엔터프라이즈 데이터 원본을 등록하고, 분류하고, 데이터 품질을 보장하고, 안전한 셀프 서비스 액세스를 제공하기 위해 Microsoft Purview에 의존합니다.
Microsoft Purview는 테넌트 기반의 서비스로, 데이터 랜딩 존의 지역에 배포된 관리형 가상 네트워크를 생성하여 각 데이터 랜딩 존과 통신할 수 있습니다. 사용 가능한 모든 Microsoft Purview 지역에서 Microsoft Purview 관리형 가상 네트워크 내에 Azure 관리형 가상 네트워크 통합 런타임(IR)을 배포할 수 있습니다. 여기에서 관리형 가상 네트워크 IR은 프라이빗 엔드포인트를 사용하여 지원되는 데이터 소스에 안전하게 연결하고 스캔할 수 있습니다. 자세한 내용은 관리형 가상 네트워크를 Microsoft Purview 계정으로 사용하기를 참조하세요. 관리형 가상 네트워크 내에서 관리형 가상 네트워크 IR을 만들면 데이터 통합 프로세스를 격리하고 안전하게 보호할 수 있습니다.
Azure Databricks를 사용하는 경우 Microsoft Purview 외에도 Azure Databricks Unity 카탈로그 사용하는 것이 좋습니다. Azure Databricks Unity 카탈로그는 Databricks 작업 영역에서 중앙 집중식 액세스 제어, 감사, 계보 및 데이터 검색 기능을 제공합니다. Unity 카탈로그를 설정하는 모범 사례는 Unity 카탈로그 모범 사례참조하세요.
참고 항목
이 문서는 주로 거버넌스를 위해 Microsoft Purview를 사용하는 데 초점을 맞추고 있지만, 기업에서는 Alation, Okera 또는 Collibra와 같은 다른 제품에 투자했을 수도 있습니다. 이러한 솔루션은 구독 기반이며 데이터 관리 랜딩 존에 배포하는 것이 좋습니다. 일부 사용자 지정 통합이 필요할 수 있습니다.
데이터 검색
데이터 검색은 기업이 소유한 모든 데이터의 상태를 반영합니다. 이 데이터를 데이터 자산이라고 합니다. 데이터 검색 중에는 데이터 자산을 검사하고 분류합니다. 데이터 검사 프로세스는 설정된 일정에 따라 데이터 원본에 직접 연결됩니다.
환경에 새 데이터 랜딩 존을 추가할 때, 관련 데이터 레이크 및 다중저장소 지속성 소스를 데이터 카탈로그 크롤러가 스캔할 수 있는 소스로 등록해야 합니다.
카탈로그를 채우기 위해 데이터 자산을 자동으로 검색하면 다음을 수행할 수 있습니다.
- Azure 및 온-프레미스 데이터 원본에서 메타데이터 크롤링
- 데이터 레이크, Blob 및 기타 지원 대상 검사
- XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro 및 ORC 파일 형식에 대한 데이터 대상에서 스키마 추출
- 검사 및 검사 규칙 집합의 구성 가능한 일정을 통해 자동화된 카탈로그 업데이트 허용
Important
환경에 새 데이터 랜딩 존을 추가할 때 Azure DevOps를 통해 연결된 데이터 레이크와 다중 언어 스토리지를 데이터 카탈로그 크롤러의 스캔, 통제 및 데이터 무결성 관리 원본으로 등록합니다.
데이터 분류
Microsoft Purview를 사용하면 파일, 테이블 또는 열 자산에 시스템 또는 사용자 지정 데이터 분류를 적용할 수 있습니다.
데이터 분류는 주체 태그와 같습니다. Microsoft Purview는 스캔하는 동안 데이터 자산 내에서 발견된 특정 데이터 유형의 콘텐츠를 표시하고 식별합니다. 민감도 레이블은 조직 데이터 내에서 분류 유형의 범주를 식별하는 데 사용됩니다. 레이블은 각 범주에 적용하려는 정책을 그룹화하는 데도 사용할 수 있습니다. Microsoft Purview는 Microsoft 365와 동일한 중요한 정보 유형을 사용하여 전체 콘텐츠 및 데이터 자산에서 기존 보안 정책 및 보호를 확장할 수 있습니다.
Microsoft Purview는 문서를 검사하고 자동으로 분류할 수 있습니다. 예를 들어 multiple.docx
이라는 파일이 있고 콘텐츠에 국가 ID 번호가 있는 경우, Microsoft Purview는 자산 세부 정보 페이지에 EU National Identification Number
와 같은 분류를 추가합니다.
SQL용 Microsoft Defender는 Azure SQL Database, Azure SQL Managed Instance 및 Azure Synapse Analytics에서 사용할 수 있는 기능입니다. 여기에는 중요한 데이터 검색 및 분류, 잠재적인 데이터베이스 취약성 표시 및 완화, 데이터베이스에 대한 위협을 나타낼 수 있는 비정상적인 활동 검색 기능이 포함됩니다. SQL용 Microsoft Defender는 이러한 기능을 사용하도록 설정하고 관리하기 위한 단일 goto 위치를 제공합니다.