Управление главными данными в сетке данных
Предприятия, использующие архитектуру сетки данных, часто имеют большое количество доменов, каждый из которых содержит уникальные системы и данные.
Это широкое распространение данных увеличивает сложность, так как в этой настройке могут существовать несколько версий одних и того же данных. Интеграция требует больше усилий, так как владельцы должны интегрировать и согласовать все различные части одних и того же данных из нескольких доменов. Данные могут быть несогласованы между этими различными доменами, а качество данных также может отличаться. Примените управление главными данными (MDM) для решения этих проблем.
Управление главными данными, ориентированными на домен
Основные идентификационные номера являются важным аспектом MDM. Эти числа связывают основные данные и данные из ваших доменов. Они критически важны для вашей способности отслеживать, какие данные были освоены и какие данные должны быть объединены. Вы можете определять уникальные данные и назначать основные идентификационные номера централизованно, а не локально в системе. Основные данные из разных систем должны быть вместе в решении MDM.
MDM работает по-разному в архитектуре, ориентированной на домен, из-за их распределенной природы. Согласованность сложнее достичь, так как в доменах используется MDM.
Один из способов обеспечения согласованности заключается в том, чтобы ваши домены следовали центрально управляемым главным данным при распределении продуктов данных. Список основных данных можно опубликовать в хранилище основных данных или центральном репозитории. Ваш домен может классифицировать данные с помощью корпоративных ссылочных идентификаторов из корпоративных эталонных данных при распределении продуктов данных между другими доменами. Это позволяет другим доменам быстро распознавать все основные данные в этих продуктах данных.
домен управления главными данными
Вы также можете создать новые домены MDM при группировке действий MDM и использовании хранилища основных данных в качестве централизованного репозитория. Каждый новый домен MDM должен содержать конкретный субъект данных, на который ориентирована идентификация и управление главными данными. Некоторые известные примеры этих данных включают клиентов, продукты, сотрудники, географические расположения и информацию о финансах и рисках. Обработанные системой MDM основные данные должны быть возвращены в другие домены. Это распределение данных аналогично распределению продуктов данных.
Вы можете ограничить управление главными данными и разрешить различные подходы к распределению продуктов данных. В пределах определенной области продукты данных не должны соответствовать корпоративным главным данным, но за пределами области продукты данных должны соответствовать. Этот шаблон также можно применить обратно, требуя соблюдения основных данных только в определенной области, а не за ее пределами. В этих настройках основные данные централизованно управляются в решении MDM. Домены должны обмениваться основными данными, чтобы они знали, какие локальные данные необходимо сопоставить с центральными основными данными. Определите и поддерживайте эти отношения, чтобы знать, какие данные управлены и какие можно оперативно связать. Если ключи локального домена в операционной системе изменяются, главный идентификатор — это единственная привязка элементов.
При распределении главных идентификаторов не экстраполируйте главные идентификаторы MDM во все исходные системы. Это может привести к проблемам согласованности. Только приложения или системы, подлежащие MDM, должны получить главный идентификатор из узла MDM. Системы, не подлежащие MDM, должны использовать собственную локальную (доменную) целостность.
Управление главными данными уровня домена
При поиске совпадающих данных вы, вероятно, обнаружите разные степени совпадения. Некоторые данные являются универсальными и охватывают множество доменов. Другие данные имеют ограниченное перекрытие и охватывает только несколько доменов. Различьте объем перекрытия данных и его важность, расширяя MDM до уровня домена. Это можно сделать, создав частичные представления основных данных в определенной области. Это полезно при совместном использовании данных между некоторыми, но не всеми доменами.
Управление главными данными уровня домена
Важно, чтобы перекрывающиеся домены управляют данными, но не имеют центральной зависимости. Решения MDM помогут вам достичь этого. Вы можете значительно упростить использование, абстрагируя инфраструктуру и предоставляя MDM в качестве службы вашим доменам. Если вы используете центральное решение, примените разделенные представления для каждого отдельного домена или области.
Обеспечение согласованности с повторно используемыми компонентами
Общий доступ к коду — это еще один способ обеспечить совместную работу и повторное использование основных данных. Вместо совместного использования основных данных вы предоставляете общий доступ к базовому коду (фрагментам и скриптам) для создания выходных данных и повышения эффективности повторного использования. Сохраните этот базовый код в центральном и открытом репозитории с помощью управления версиями. Все команды могут вносить свой вклад в код, который живет в этом репозитории.
В этой модели бизнес-логика применяется только в доменах. Ваши команды могут отклоняться, вносить улучшения или использовать слегка оптимизированные версии логики на свое усмотрение. Вы можете обновить свои результаты, когда улучшения от сообщества добавляются в ваш основной репозиторий кода.
Обратите внимание, что разрешение команд изменять свой код может сделать сравнение результатов между различными командами сложнее, что может повлиять на согласованность.
Сводка по управлению главными данными
Пользователи могут принимать правильные решения только в том случае, если используемые данные являются согласованными и правильными. С помощью MDM можно обеспечить согласованность и качество данных на корпоративном уровне.
Ваша организация должна найти правильный баланс для MDM. Наличие чрезмерного количества областей основных данных или справочных значений приводит к слишком большому совмещению между доменами. Отсутствие корпоративных данных вообще не позволяет сравнивать результаты. Практический способ начать использование MDM в сбалансированном способе заключается в реализации репозитория. Это самый простой способ управления главными данными организации. С помощью репозитория вам не нужно настраивать доменные системы, чтобы узнать, какие данные являются низким качеством или должны быть выровнены. С помощью репозитория, помогающего получить эту информацию, вы можете быстрее доставить ценность.
После реализации репозитория необходимо указать четкую область. Не падайте в ловушку объединения корпоративных данных, выбрав все данные. Только основные данные из наиболее важных полей. Начните с выбора субъектов, которые добавляют большую ценность, такие как клиенты, контракты, продукты и подразделения. Количество атрибутов должно находиться в десятках, а не в сотнях или тысячах.
Выровняйте процессы и управление после того, как вы пришли к соглашению с вашими доменами. Сделайте все соглашения по срокам и обзорам ясными для всех областей. Кроме того, убедитесь, что вы работаете над метаданными. Каталогируйте основные данные. Убедитесь, что домены знают, какие элементы данных являются кандидатами из исходных систем и как эти элементы передаются через конвейеры данных.
Заключительный шаг, и ваша конечная цель, заключается в достижении сосуществования. Улучшения должны напрямую возвращаться в ваши домены. Это самая сложная часть процесса, так как требуется внести много изменений архитектуры. Ваши домены должны иметь возможность обрабатывать исправления и улучшения, отправленные из централизованно управляемого решения MDM.