다음을 통해 공유


Microsoft Purview의 데이터 제품

참고

Microsoft Purview 데이터 카탈로그 이름을 Microsoft Purview 통합 카탈로그로 변경합니다. 모든 기능은 동일하게 유지됩니다. 새 Microsoft Purview 데이터 거버넌스 환경을 해당 지역에서 일반적으로 사용할 수 있는 경우 이름이 변경됩니다. 해당 지역의 이름을 확인합니다.

데이터 제품은 데이터 자산(테이블, 파일, PBI 보고서 등)의 그룹으로, 데이터 소비자에게 공유할 사용 사례와 함께 자산을 제공하는 엔터프라이즈에 패키지된 제품입니다.

Microsoft Purview에서 데이터 거버넌스는 데이터가 안전하고 규정을 준수하는지 확인하는 방법일 뿐만 아니라 데이터의 비즈니스 가치를 가속화하는 도구이기도 합니다. 자산에서 데이터를 카탈로그화하면 데이터를 올바르게 사용할 수 있도록 더 잘 관리할 수 있지만 데이터 환경의 전체 그림도 제공합니다. 이제 사용 가능한 모든 데이터 자산 목록이 있으므로 사용자는 더 이상 네트워킹 또는 팀 지식에 의존하여 필요한 것을 찾을 필요가 없습니다. 카탈로그 자체를 검색할 수 있습니다. 그러나 모든 사용자에게 사용 가능한 모든 데이터의 원시 목록을 제공하는 것은 압도적이며 본질적으로 유용하지 않습니다. 좋은 설명, 태그 지정 및 용어집 용어를 사용하더라도 원하는 내용을 알기 어려울 수 있습니다. 그리고 완전한 데이터 시각화를 위해서는 데이터 자산이 하나뿐 아니라 여러 데이터 자산이 필요할 수 있습니다. 데이터 카탈로그가 증가함에 따라 사용자가 필요한 데이터에 대한 액세스를 더 쉽게 찾고 요청할 수 있도록 컨텍스트가 함께 증가해야 합니다.

확장 가능한 데이터 컨텍스트 및 액세스 관리를 제공하기 위해 Microsoft Purview는 데이터 제품을 도입합니다.

데이터 제품이란?

데이터 제품은 이름, 설명, 소유자 및 가장 중요한 관련 데이터 자산 목록을 포함하는 비즈니스 개념입니다. 데이터 제품은 이러한 자산에 대한 컨텍스트를 제공하여 데이터 소비자의 사용 사례에 따라 그룹화합니다. 거버넌스 도메인은 많은 데이터 제품을 보관할 수 있지만 데이터 제품은 단일 거버넌스 도메인 에서 관리되며 여러 도메인에서 검색할 수 있습니다.

성공적인 데이터 제품을 사용하면 데이터 소비자가 일상적인 언어를 사용하여 중요한 데이터를 쉽게 인식할 수 있으며 동시에 해당 데이터 자산에 대한 소유권 책임을 간소화할 수 있습니다. 어떻게 생겼는지 살펴보겠습니다.

확장 가능한 데이터 컨텍스트

예를 들어 데이터 과학자는 데이터 모델이 사용할 데이터 자산 집합을 만들고 다른 사용자가 동일한 데이터 세트를 사용할 수 있기를 원합니다.

데이터 제품이 없으면 데이터 과학자는 데이터 카탈로그를 사용하여 모든 관련 데이터 자산에 용어집 용어를 추가할 수 있습니다. 사용자는 검색할 용어집 용어를 모를 수 있으므로 각 데이터 자산에 설명을 추가하여 유사한 정보를 검색할 때 더 관련성이 높아질 수 있습니다. 그러나 두 추가 기능 모두 다른 사용자가 연결된 모든 데이터 자산을 볼 수 있다고 보장하지는 않습니다. 관련이 없는 다른 자산을 그룹화하거나 중요한 데이터 조각을 놓치고 원래 데이터 과학자가 이미 수행한 연구를 반복하는 데 시간을 할애할 수 있습니다.

데이터 제품을 사용하면 데이터 과학자가 데이터 모델을 만드는 데 사용되는 모든 자산을 나열하는 데이터 제품을 만들 수 있습니다. 설명은 데이터 사용 방법에 대한 예제 또는 제안 사항과 함께 전체 사용 사례를 제공합니다. 데이터 과학자는 이제 데이터 제품 소유자이며 이 하나의 데이터 제품에 필요한 모든 것을 얻을 수 있도록 지원하여 데이터 소비자의 검색 환경을 개선했습니다.

확장 가능한 데이터 거버넌스

데이터 제품은 데이터 자산에 대한 거버넌스도 간소화합니다. 데이터 자산 집합을 만드는 데이터 과학자의 동일한 예제 사용:

데이터 제품이 없으면 사용자가 데이터 집합에 대한 데이터 자산에 액세스하려면 각 데이터 자산에 대한 액세스를 개별적으로 요청해야 합니다. 데이터 소유자는 이러한 자산이 기계 학습 모델에 사용되고 있음을 알 수 있지만 보안 및 사용 사례와 관련된 정책에 대한 변경 사항이 있는 경우 데이터 소유자는 각 자산으로 개별적으로 이동하여 업데이트를 수행해야 합니다.

데이터 제품을 사용하면 사용자가 데이터 제품을 찾은 후 데이터 제품에 대한 액세스를 요청할 수 있으며, 이를 통해 연결된 모든 데이터 자산에 대한 액세스(승인 후)를 제공할 수 있습니다. 기계 학습을 위한 데이터 세트에 대해 더 많은 승인 또는 데이터 사용 정책을 적용하는 경우 데이터 소유자는 데이터 제품에 새 정책만 적용하면 되며 자산에 자동으로 다운됩니다.

데이터 제품은 비즈니스 상태 제어 및 OKR과도 연결됩니다. 이러한 제어를 통해 데이터 소유자는 데이터 상태를 평가하고 주의가 필요한 자산의 우선 순위를 지정하고 비즈니스 가치를 제공하는 데이터 자산을 평가할 수 있습니다. 이를 통해 자산의 완전한 데이터 거버넌스를 향한 진전을 지원할 뿐만 아니라 데이터에서 비즈니스 가치를 개발하도록 장려할 수 있습니다. 자산은 더 이상 추상화되지 않지만 팀이 집중할 수 있는 실제 사용 사례 및 비즈니스 목표와 관련이 있습니다.

데이터 액세스 정책

데이터 보안 및 액세스는 성공적인 데이터 거버넌스의 핵심 테넌트입니다. 그러나 데이터 거버넌스를 구현하고 데이터 사용을 성공적으로 추진하려면 데이터 액세스 프로세스가 데이터 자산 전체의 모든 시나리오에 대해 안전하고 편리하며 사용자 지정할 수 있어야 합니다. 일부 데이터는 널리 사용 가능하고 액세스할 수 있어야 하며, 일부는 올바른 사용을 보장하기 위해 엄격한 승인 및 모니터링을 받아야 합니다.

각 데이터 제품에는 사용자가 액세스를 요청하는 방법, 데이터에 대한 사용 약관 및 데이터에 대한 액세스를 승인해야 하는 사용자를 결정하는 액세스 정책이 있습니다. 이러한 각 액세스 정책은 적절한 용도로 사용자 지정할 수 있으며 향후 더 많은 사용 사례를 포함하도록 발전할 것입니다. 모든 사용자는 데이터 제품 내에서 액세스 요청 을 선택하면 사용 약관에 동의하고 올바른 당사자의 승인을 받기 위해 프로세스를 통해 자동으로 수행됩니다.

데이터 제품에 대한 액세스에 대한 자세한 내용은 Microsoft Purview에서 데이터 카탈로그 액세스 정책 관리에 대한 문서를 참조하세요.

다음 단계