다음을 통해 공유


데이터 제어를 위한 요구 사항

클라우드 규모 분석에서는 데이터를 관리하기 위한 다음 요구 사항을 고려하는 것이 좋습니다.

  • 비즈니스 용어집에 일반적인 비즈니스 용어 모음을 만들기 위한 데이터 엔터티 정의입니다. 이 컨텍스트의 데이터 엔터티는 고객, 공급업체, 재료, 직원 등의 개념을 의미합니다.
  • 데이터 엔터티 식별 및 검색
  • 데이터 액세스 보안, 데이터 개인 정보 및 데이터 보존을 제어하기 위한 데이터 분류입니다.
  • 거버넌스 책임이 있는 데이터 소유자 및 데이터 보호 및 품질을 담당하는 데이터 관리자와 같은 사용자.
  • 데이터 거버넌스 프로세스.
  • 데이터를 보관해야 하는 기간을 제어하는 데이터 수명 주기 관리
  • 수명 주기 동안 특정 데이터를 관리하는 방법을 정의하는 정책 및 규칙입니다.
  • 분산 데이터 환경의 데이터 저장소에서 정책을 적용합니다.
  • 마스터 데이터 관리를 통해 고객, 제품 및 공급업체와 같은 운영 및 분석 시스템에서 데이터를 일관되게 유지합니다.
  • 데이터 엔터티의 변환 및 관계를 이해하기 위한 메타데이터 계보입니다.
  • 구조화되고, 다구조화되고, 구조화되지 않은 데이터를 제어할 수 있도록 하는 기술입니다. 거버넌스는 데이터 센터, 여러 클라우드 및 에지에 전반에 있을 수 있습니다.

한 가지 과제는 데이터가 수집되어 기업 전반의 여러 위치에 저장된다는 것입니다. 데이터에는 서로 다른 지역 및 다른 법적 관할권에 수집 및 저장된 데이터가 포함될 수 있습니다. 따라서 다른 관할권에서 동일한 데이터를 관리하는 데 다른 법률이 적용될 수 있습니다. 여러 클라우드 및 지리적 위치에 분산된 데이터를 검색하여 다음을 수행합니다.

  • 분산 데이터 환경에서 존재하는 데이터 특성, 데이터 엔터티 및 데이터 관계를 이해합니다.
  • 데이터를 제어하는 방법을 알 수 있도록 데이터 분류
  • 각 데이터 분류 유형 및 수명 주기 관리에 대해 데이터를 관리하는 방법을 지정하는 정책을 정의합니다.
  • 분산 데이터 환경에서 데이터 품질, 데이터 액세스 보안, 데이터 개인 정보 및 수명 주기 관리 정책을 적용합니다.

데이터 분류

데이터 분류는 데이터 자산에 고유한 논리 태그 또는 클래스를 할당하여 데이터 자산을 분류하는 방법입니다. 분류는 데이터의 비즈니스 컨텍스트를 기준으로 합니다.

기밀성 수준과 유지 기간을 이해하기 위해 데이터를 분류하는 방법이 있어야 합니다. 분류에는 다음이 필요합니다.

  • 데이터 기밀성 분류 체계
  • 데이터 보존 분류 체계

데이터 기밀성 분류 체계

분류 설명
공개 누구나 데이터에 액세스할 수 있으며 누구에게나 전송할 수 있습니다. 정부의 공개 데이터를 예제로 들 수 있습니다.
내부적으로만 사용됩니다. 직원만 데이터에 액세스할 수 있으며 회사 외부로 전송할 수 없습니다.
비밀 특정 작업에 필요한 경우에만 데이터를 공유할 수 있습니다. 비밀 유지 계약 없이는 회사 외부로 데이터를 전송할 수 없습니다.
중요(개인 데이터) 꼭 알아야 하는 필요가 있는 경우에 한하여 제한된 시간 동안만 마스킹되고 공유되어야 하는 비공개 정보가 포함된 데이터입니다. 권한이 없는 직원에게 또는 회사 외부로 데이터를 전송할 수 없습니다.
Restricted 해당 데이터 보호에 대한 책임이 있는 명명된 개인과만 데이터를 공유할 수 있습니다. 법적 문서 또는 영업 비밀을 예제로 들 수 있습니다.

데이터 수명 주기 보존 분류 체계

유지 설명
None 언제든지 데이터를 삭제할 수 있습니다.
임시 짧은 시간 동안 데이터를 유지합니다. 예를 들어 Twitter 데이터를 일주일 동안 유지합니다.
고정 기간 설정된 연도 수 동안 데이터를 유지한 후 삭제할 수 있습니다. 예를 들어 정부 법률을 준수하기 위해 7년 동안 세금 기록을 보관합니다.
영구 데이터를 삭제하지 않습니다. 예를 들어 법적 대응입니다.

분산 데이터 환경에서 데이터를 일관되게 레이블을 지정하려면 각 분류 체계에 정의된 클래스를 사용하여 데이터 기밀성 및 데이터 수명 주기 보존 분류 프로세스를 자동화해야 합니다. 자동화를 사용하면 일관되고 올바르게 제어할 수 있습니다. 그런 다음 분류 체계에서 각 클래스에 대한 규칙 및 분류 체계를 정의하여 분류에 따라 데이터를 제어하는 방법을 지정합니다.

데이터 거버넌스 역할 및 책임

또 다른 요구 사항은 책임의 필요성입니다. 그렇지 않으면 누가 데이터를 관리해야 하는가에 대한 혼란이 남아 있습니다. 아무도 책임이 없는 경우 다음 질문에 어떻게 대답하시겠습니까?

  • 누가 성공 메트릭을 설정하고 데이터 거버넌스 프로그램이 얼마나 잘 작동하는지 모니터합니까?
  • 데이터 소유자는 누구인가요?
  • 누가 비즈니스 용어집을 정의하고 유지 관리합니까?
  • 누가 액세스 보안에 대한 정책을 만들고 유지 관리합니까?
  • 누가 규정 준수를 위해 개인 데이터 개인 정보를 보호합니까?
  • 누가 모든 브로슈어 및 파트너 웹 사이트에서 제품 데이터의 품질을 돌봅니까?
  • 누가 모든 시스템에서 고객 데이터가 일관되도록 보장합니까?
  • 누가 외부 구독 데이터 사용량과 라이선스를 감시합니까?
  • 누가 데이터베이스 관리자 및 데이터 과학자와 같은 권한 있는 사용자를 감시하고 있습니까?
  • C급 임원입니까? 부서장입니까?
  • 거버넌스, 위험 및 규정 준수 책임자입니까?
  • 법률 부서는 어떻습니까?
  • IT의 책임인가요?

혼동을 피하고 데이터 문화권이 구체화할 수 있는 기반을 설정하려면 역할과 책임이 필요합니다.

데이터 거버넌스 프로세스

프로세스가 필요하며 다음과 같은 역할 및 책임도 함께 필요합니다.

  • 일반적인 비즈니스 용어 모음의 정의 및 유지 관리 제어
  • 보유하고 있는 데이터와 그 의미 및 저장되는 위치를 검색하고 식별합니다.
  • 데이터를 분류하여 제어하는 방법 알아보기
  • 데이터 액세스 보안 정책의 정의 및 유지 관리 제어
  • 데이터 개인 정보 취급 방침의 정의 및 유지 관리 제어
  • 데이터 품질 문제 감지 및 수정
  • 규정 준수를 위한 조치를 취하도록 정책 적용
  • 마스터 데이터의 유지 관리 제어

데이터 거버넌스 정책 및 규칙

다음을 제어할 정책 및 규칙을 정의합니다.

  • 데이터 무결성 규칙
  • 데이터 수집 정책 및 규칙
  • 데이터 액세스 보안 정책 및 규칙
  • 데이터 개인 정보 취급 방침 및 규칙
  • 데이터 품질 정책 및 규칙
  • 데이터 유지 관리 정책 및 규칙
  • 데이터 보존 정책 및 규칙

이러한 정책 및 규칙을 데이터 거버넌스 분류 체계의 각 클래스와 연결합니다.

마스터 데이터 관리

데이터 관리의 또 다른 요구 사항은 마스터 데이터 관리입니다. 마스터 데이터는 모든 조직에서 가장 널리 공유되는 데이터이며 핵심 데이터 엔터티를 포함합니다. 핵심 데이터 엔터티에는 고객, 공급업체, 재료, 직원 및 자산이 포함됩니다. 또한 다른 금융 애플리케이션에서 찾을 수 있는 계정 데이터의 재무 차트도 포함됩니다. 마스터 데이터는 매우 널리 공유되므로 애플리케이션에 구애받지 않습니다. 운영 트랜잭션 처리 애플리케이션과 분석 시스템 모두에 필요합니다. 이 데이터를 동기화된 상태로 유지하면 많은 데이터 오류와 프로세스 오류를 해결할 수 있습니다. 따라서 공통 프로세스를 통해 중앙에서 유지 관리하고 필요한 모든 시스템을 동기화하는 것이 이상적인 상황입니다. 또한 유지 관리가 허용되는 사용자와 유지 관리가 필요한 위치에 대한 거버넌스가 필요합니다.

코드 집합 및 금융 시장 데이터와 같은 참조 데이터도 마찬가지입니다. 이 경우 코드 집합의 표준화 및 동기화를 참조 데이터 관리라고 하며 이는 요구 사항이기도 합니다.

메타데이터 계보

마지막으로 메타데이터 계보에 대한 요구 사항이 있습니다. 감사 추적을 사용하여 데이터가 시작된 위치와 보고서 또는 데이터 저장소로의 경로에서 데이터가 변환되는 방법을 알 수 있습니다. 메타데이터를 사용하여 데이터의 발생 시기 및 위치를 포함하여 누가 또는 무엇을 유지 관리하는지 추적할 수 있습니다.

엔드투엔드 데이터 거버넌스에 필요한 사항 요약

에지, 여러 클라우드 및 데이터 센터의 데이터 저장소에서 수명 주기 내내 데이터를 관리할 수 있는 엔드투엔드 솔루션이 필요합니다.

데이터 거버넌스 프레임워크의 다이어그램

데이터 거버넌스 솔루션에는 다음과 같은 몇 가지 구성 요소가 있어야 합니다.

  • 데이터 거버넌스 비전 및 전략
  • 고객 데이터, 공급업체 데이터, 주문 데이터 등과 같은 데이터 자체입니다.
  • 관리해야 하는 데이터의 생성부터 소멸까지 데이터 수명 주기입니다.
  • 데이터 거버넌스 역할 및 책임(사람).
  • 데이터 거버넌스 프로세스 및 활동 그리고 데이터 수명 주기에 적용되는 방법.
  • 수명 주기의 여러 지점에서 데이터를 제어하는 정책 및 규칙입니다.
  • 데이터 거버넌스를 가능하게 하는 데 도움이 되는 데이터 거버넌스 기술입니다.

다음 단계