Zarządzanie danymi głównymi w siatkach danych
Przedsiębiorstwa korzystające z architektury siatki danych często mają dużą liczbę domen, z których każda zawiera unikatowe systemy i dane.
Ta powszechna dystrybucja danych zwiększa złożoność, ponieważ w tej konfiguracji może istnieć wiele wersji tych samych danych. Integracja wymaga więcej wysiłku, ponieważ właściciele muszą zintegrować i zharmonizować wszystkie różne części tych samych danych z wielu domen. Dane mogą być niespójne między tymi różnymi domenami, a jakość danych może się również różnić. Zastosuj master data management (MDM), aby sprostać tym wyzwaniom.
Zarządzanie danymi głównymi zorientowanymi na domenę
Główne numery identyfikacyjne są ważnym aspektem rozwiązania MDM. Te liczby łączą opanowane dane i dane z domen. Mają one kluczowe znaczenie dla twojej zdolności do śledzenia danych, które zostały zweryfikowane, oraz jakie dane należą do siebie. Unikatowe dane można identyfikować tylko i przypisywać główne numery identyfikacyjne centralnie, a nie lokalnie w systemie. Dane główne z różnych systemów muszą znajdować się razem w rozwiązaniu MDM.
Rozwiązanie MDM działa inaczej w architekturach zorientowanych na domenę ze względu na ich rozproszony charakter. Spójność jest trudniejsza do osiągnięcia, ponieważ polegasz na MDM w swoich domenach.
Jednym ze sposobów osiągnięcia spójności jest poproszenie domen, aby dostosowały się do centralnie zarządzanych danych głównych przy rozprowadzaniu produktów danych . Listę danych głównych można opublikować w głównym magazynie danych lub w centralnym repozytorium. Twoja domena może klasyfikować dane przy użyciu identyfikatorów referencyjnych z danych referencyjnych twojego przedsiębiorstwa podczas dystrybucji produktów danych w innych domenach. Dzięki temu inne domeny szybko rozpoznają wszystkie dane główne w tych produktach danych.
domeny zarządzania danymi głównymi
Można również utworzyć nowe domeny MDM podczas grupowania działań MDM i używania głównego magazynu danych jako scentralizowanego repozytorium. Każda nowa domena MDM powinna zawierać określony podmiot danych, na który koncentruje się identyfikacja i kontrola danych głównych. Niektóre dobrze znane przykłady tych danych obejmują klientów, produkty, pracowników, lokalizacje geograficzne oraz informacje o finansach i ryzyku. Dane główne z tych domen MDM muszą znaleźć drogę powrotną do innych domen. Ta dystrybucja danych jest podobna do rozkładu produktów danych.
Można określić zakres zarządzania danymi głównymi i zezwolić na różne podejścia do dystrybucji produktów danych. W granicach określonego zakresu produkty danych nie muszą być zgodne z danymi głównymi przedsiębiorstwa, ale poza granicami zakresu produkty danych muszą być zgodne. Można również zastosować ten wzorzec odwrotnie, wymagając przestrzegania danych głównych tylko w określonym zakresie, a nie poza nim. W tych konfiguracjach dane mastered są centralnie zarządzane w ramach rozwiązania MDM. Domeny muszą wymieniać dane główne, aby wiedzieć, które dane lokalne należy przyporządkować do centralnych danych głównych. Zidentyfikuj i zachowaj te relacje, aby wiedzieć, które dane zostały opanowane i które dane można szybko połączyć. Jeśli lokalne klucze domeny w systemie operacyjnym ulegną zmianie, master ID jest jedynym elementem łączącym wszystko razem.
Podczas dystrybucji identyfikatorów głównych nie należy ekstrapolować identyfikatorów głównych mdM do wszystkich systemów źródłowych. Może to spowodować problemy ze spójnością. Tylko aplikacje lub systemy, które podlegają rozwiązaniu MDM, powinny uzyskać identyfikator główny z centrum MDM. Systemy, które nie podlegają zarządzaniu MDM, powinny używać własnej integralności lokalnej (domeny).
Zarządzanie danymi głównymi na poziomie domeny
Gdy szukasz nakładających się danych, prawdopodobnie odkryjesz różne stopnie nakładania się danych. Niektóre dane są ogólne i obejmują wiele domen. Inne dane mają ograniczone nakładanie się i obejmuje tylko kilka domen. Rozróżnij ilość nachodzących na siebie danych i ich znaczenie, poprzez rozszerzenie zarządzania głównymi danymi (MDM) na poziom domeny. Można to zrobić, tworząc częściowe widoki danych głównych w określonym zakresie. Jest to przydatne, gdy dane są udostępniane między niektórymi, ale nie wszystkimi domenami.
Ważne jest, aby nakładające się domeny zarządzały danymi, ale nie miały centralnej zależności. Rozwiązania MDM mogą pomóc w osiągnięciu tego celu. Użycie można znacznie uprościć, abstrahując infrastrukturę i udostępniając rozwiązanie MDM jako usługę domenom. Jeśli używasz centralnego rozwiązania, zastosuj segregowane widoki dla każdej domeny lub zakresu.
Osiągnięcie spójności ze składnikami wielokrotnego użytku
Udostępnianie kodu to inny sposób zapewnienia współpracy i możliwości ponownego korzystania z danych głównych. Zamiast udostępniać dane główne, udostępniasz podstawowy kod (fragmenty kodu i skrypty), aby wygenerować dane wyjściowe i promować skuteczne ponowne użycie. Zapisz ten podstawowy kod w centralnym i otwartym repozytorium za pomocą kontroli wersji. Zespoły mogą współtworzyć i ulepszać kod, który znajduje się w tym repozytorium.
W tym modelu stosuje się logikę biznesową tylko w domenach. Zespoły mogą odbiegać od standardu, wprowadzać ulepszenia lub używać nieco zoptymalizowanych wersji logiki według własnego uznania. Możesz ponownie wygenerować dane wyjściowe, w miarę jak ulepszenia od Twojej społeczności są dodawane do centralnej bazy kodu.
Należy pamiętać, że umożliwienie zespołom modyfikowania kodu może utrudnić porównywanie wyników między różnymi zespołami, co może mieć wpływ na spójność.
Podsumowanie zarządzania danymi głównymi
Użytkownicy mogą podejmować prawidłowe decyzje tylko wtedy, gdy używane dane są spójne i poprawne. Za pomocą rozwiązania MDM można zapewnić spójność i jakość danych na poziomie przedsiębiorstwa.
Twoja organizacja musi znaleźć właściwą równowagę dla rozwiązania MDM. Posiadanie zbyt wielu obszarów danych głównych lub wartości referencyjnych prowadzi do zbyt wielu uzgodnień międzydomenowych. Brak danych przedsiębiorstwa sprawia, że nie można porównać żadnych wyników. Praktycznym sposobem rozpoczęcia korzystania z rozwiązania MDM w zrównoważony sposób jest zaimplementowanie repozytorium. Jest to najprostszy sposób zarządzania danymi głównymi organizacji. W przypadku repozytorium nie trzeba dostosowywać systemów domen, aby dowiedzieć się, jakie dane są niskiej jakości lub które należy dopasować. Dzięki repozytorium ułatwiającemu uzyskanie tych informacji można szybciej dostarczać wartość.
Po zaimplementowaniu repozytorium należy określić jasny zakres. Nie należy wpadać w pułapkę zjednoczenia danych przedsiębiorstwa, wybierając wszystkie dane. Tylko dane główne z najważniejszych pól. Zacznij od wybrania tematów, które dodają największą wartość, na przykład klientów, kontraktów, produktów i jednostek organizacyjnych. Liczba atrybutów powinna znajdować się w dziesiątkach, a nie setkach lub tysiącach.
Dopasuj procesy i ład po zawarciu umowy z domenami. Uczyń uzgodnienia dotyczące harmonogramów i przeglądów jasne dla wszystkich obszarów działań. Upewnij się również, że pracujesz nad metadanymi. Skataloguj dane główne. Upewnij się, że twoje domeny wiedzą, które elementy danych są kandydatami i z jakich systemów źródłowych pochodzą, oraz jak te elementy przepływają przez przepływy danych.
Ostatnim krokiem i ostatecznym celem jest osiągnięcie współistnienia. Ulepszenia powinny przepływać bezpośrednio do domen. Jest to najtrudniejsza część procesu, ponieważ wymaga wprowadzenia wielu zmian architektury. Domeny muszą mieć możliwość obsługi poprawek i ulepszeń wysyłanych z centralnie zarządzanego rozwiązania MDM.