데이터 메시에서 마스터 데이터 관리
데이터 메시 아키텍처를 사용하는 엔터프라이즈에는 각각 고유한 시스템과 데이터를 포함하는 많은 수의 도메인이 있습니다.
이러한 광범위한 데이터 배포는 이 설정에서 동일한 데이터의 여러 버전이 존재할 수 있기 때문에 복잡성을 증가합니다. 소유자가 여러 도메인에서 동일한 데이터의 모든 다른 부분을 통합하고 조화해야 하므로 통합을 위해서는 더 많은 노력이 필요합니다. 이러한 서로 다른 도메인 간에 데이터가 일치하지 않을 수 있으며 데이터 품질도 다를 수 있습니다. MDM(마스터 데이터 관리) 적용하여 이러한 문제를 해결합니다.
도메인 기반 마스터 데이터 관리
마스터 ID 번호는 MDM의 중요한 측면입니다. 이러한 숫자는 도메인의 마스터된 데이터와 데이터를 함께 연결합니다. 여러분이 마스터된 데이터와 상호 연관된 데이터를 추적할 수 있는 능력에 매우 중요합니다. 고유한 데이터를 식별하고 시스템 내에서 로컬이 아닌 중앙에서만 마스터 ID 번호를 할당할 수 있습니다. 다른 시스템의 마스터 데이터는 MDM 솔루션 내에 함께 있어야 합니다.
MDM은 분산된 특성으로 인해 도메인 기반 아키텍처에서 다르게 작동합니다. 도메인 내에서 MDM에 의존하기 때문에 일관성을 달성하기가 더 어렵습니다.
일관성을 달성하는 한 가지 방법은
MDM 활동을 그룹화하고 마스터 데이터 저장소를 중앙 집중식 리포지토리로 사용할 때 새 MDM 도메인을 만들 수도 있습니다. 각 새 MDM 도메인에는 마스터 데이터의 식별 및 제어에 중점을 둔 특정 데이터 주체가 포함되어야 합니다. 이 데이터의 몇 가지 잘 알려진 예로는 고객, 제품, 직원, 지리적 위치, 재무 및 위험 정보가 있습니다. 이러한 MDM 도메인의 마스터된 데이터는 다른 도메인으로 돌아가야 합니다. 이 데이터 배포는 데이터 제품의 배포와 유사합니다.
마스터 데이터 관리의 범위를 지정하고 데이터 제품 배포에 대한 다양한 접근 방식을 허용할 수 있습니다. 특정 범위의 경계 내에서 데이터 제품은 엔터프라이즈 마스터 데이터를 준수할 필요가 없지만 범위의 경계를 넘어 데이터 제품을 준수해야 합니다. 또한 이 패턴을 반대로 적용할 수 있으며, 마스터 데이터에 대한 준수를 특정 범위 내에서만 요구하고 외부에서는 요구하지 않을 수 있습니다. 이러한 설정에서 마스터된 데이터는 MDM 솔루션 내에서 중앙에서 관리됩니다. 도메인은 중앙 마스터 데이터에 매핑할 로컬 데이터를 알 수 있도록 마스터 데이터를 교환해야 합니다. 마스터된 데이터와 빠르게 연결할 수 있는 데이터를 알 수 있도록 이러한 관계를 식별하고 유지 관리합니다. 운영 시스템의 로컬 도메인 키가 변경되면 마스터 식별자가 모든 항목을 함께 바인딩하는 유일한 요소입니다.
마스터 식별자를 배포할 때 MDM 마스터 식별자를 모든 원본 시스템에 확장하지 마세요. 이렇게 하면 일관성 문제가 발생할 수 있습니다. MDM이 적용되는 애플리케이션 또는 시스템만 MDM 허브에서 마스터 식별자를 가져와야 합니다. MDM이 적용되지 않는 시스템은 자체 로컬(도메인) 무결성을 사용해야 합니다.
도메인 수준 마스터 데이터 관리
겹치는 데이터를 찾으면 다양한 수준의 겹침을 발견할 수 있습니다. 일부 데이터는 제네릭이며 많은 도메인에 걸쳐 있습니다. 다른 데이터는 중복이 제한되며 일부 도메인에만 걸쳐 있습니다. MDM을 도메인 수준 MDM으로 확장하여 데이터 겹침 양과 중요도를 구분합니다. 특정 범위 내에서 마스터 데이터의 부분 보기를 만들어 이 작업을 수행할 수 있습니다. 이는 데이터가 도메인의 일부(전부는 아님) 간에 공유되는 경우에 유용합니다.
겹치는 도메인은 데이터를 관리하지만 중앙 종속성은 없는 것이 중요합니다. MDM 솔루션은 이를 달성하는 데 도움이 될 수 있습니다. 인프라를 추상화하고 MDM을 도메인에 서비스로 제공하여 사용량을 크게 간소화할 수 있습니다. 중앙 솔루션을 사용하는 경우 각 개별 도메인 또는 범위에 대해 분리된 보기를 적용합니다.
재사용 가능한 구성 요소를 사용하여 일관성 달성
코드 공유는 마스터 데이터 공동 작업 및 재사용 가능성을 보장하는 또 다른 방법입니다. 마스터 데이터를 공유하는 대신 기본 코드(코드 조각 및 스크립트)를 공유하여 출력을 생성하고 효과적인 재사용을 촉진합니다. 이 기본 코드를 버전 제어를 사용하여 중앙 및 열린 리포지토리에 저장합니다. 팀은 모두 이 리포지토리에 있는 코드에 기여하고 개선할 수 있습니다.
이 모델에서는 도메인 내에서만 비즈니스 논리를 적용합니다. 팀은 팀의 판단에 따라 논리에서 벗어나거나 개선하거나 약간 최적화된 버전을 사용할 수 있습니다. 커뮤니티의 개선 사항이 중앙 코드 리포지토리에 추가되면 출력을 다시 생성할 수 있습니다.
팀이 코드를 수정할 수 있도록 하면 다양한 팀 간의 결과를 비교하기가 더 어려워질 수 있으므로 일관성에 영향을 줄 수 있습니다.
마스터 데이터 관리 요약
사용자가 사용하는 데이터가 일관되고 올바른 경우에만 올바른 결정을 내릴 수 있습니다. MDM을 사용하면 엔터프라이즈 수준에서 데이터의 일관성과 품질을 보장할 수 있습니다.
조직에서 MDM에 대한 올바른 균형을 찾아야 합니다. 마스터 데이터 또는 참조 값의 영역이 너무 많으면 도메인 간 맞춤이 너무 많이 발생합니다. 엔터프라이즈 데이터가 전혀 없으면 결과를 비교할 수 없습니다. 분산된 방식으로 MDM 사용을 시작하는 실용적인 방법은 리포지토리를 구현하는 것입니다. 조직의 마스터 데이터를 관리하는 가장 간단한 방법입니다. 리포지토리를 사용하면 품질이 낮거나 정렬해야 하는 데이터를 알아보기 위해 도메인 시스템을 조정할 필요가 없습니다. 해당 정보를 얻는 데 도움이 되는 리포지토리를 사용하면 더 빠르게 가치를 제공할 수 있습니다.
리포지토리를 구현한 후에는 명확한 범위를 간략하게 설명해야 합니다. 모든 데이터를 선택하여 엔터프라이즈 데이터 통합의 함정에 빠지지 마세요. 가장 중요한 필드의 마스터 데이터만. 먼저 고객, 계약, 제품 및 조직 구성 단위와 같이 가장 많은 가치를 추가하는 주제를 선택합니다. 특성 수는 수백 또는 수천이 아니라 수십 개에 있어야 합니다.
도메인과 계약을 맺은 후 프로세스 및 거버넌스를 조정합니다. 타임라인 및 리뷰에 대한 모든 규약을 모든 도메인에 명확하게 적용합니다. 또한 메타데이터에 대해 작업하세요. 마스터 데이터를 카탈로그화하세요. 도메인에서 어떤 데이터 요소가 어떤 원본 시스템의 후보인지, 그리고 해당 요소가 데이터 파이프라인을 통해 흐르는 방식을 알고 있는지 확인합니다.
마지막 단계와 궁극적인 목표는 공존을 달성하는 것입니다. 귀하의 개선 사항은 직접 귀하의 도메인으로 되돌아가야 합니다. 이는 많은 아키텍처를 변경해야 하기 때문에 프로세스에서 가장 어려운 부분입니다. 도메인은 중앙에서 관리되는 MDM 솔루션에서 보낸 수정 및 개선 사항을 처리할 수 있어야 합니다.