Hoofdgegevens beheren in data mesh
Ondernemingen die een data mesh-architectuur gebruiken, hebben vaak een groot aantal domeinen, die elk unieke systemen en gegevens bevatten.
Deze wijdverspreide distributie van gegevens verhoogt de complexiteit omdat er mogelijk meerdere versies van dezelfde gegevens aanwezig zijn in deze installatie. Integratie vereist meer inspanning omdat eigenaren alle verschillende delen van dezelfde gegevens uit meerdere domeinen moeten integreren en harmoniseren. Gegevens kunnen inconsistent zijn tussen deze verschillende domeinen en de gegevenskwaliteit kan ook variëren. Pas MDM- (Master Data Management) toe om deze uitdagingen aan te pakken.
Domeingeoriënteerd hoofdgegevensbeheer
Hoofdidentificatienummers zijn een belangrijk aspect van uw MDM. Deze nummers koppelen gemasterde gegevens en gegevens uit uw domeinen aan elkaar. Ze zijn essentieel voor uw vermogen om op te sporen welke gegevens zijn gemasterd en welke gegevens bij elkaar horen. U kunt alleen unieke gegevens identificeren en hoofdidentificatienummers centraal toewijzen, niet lokaal binnen een systeem. Uw hoofdgegevens uit verschillende systemen moeten samen zijn binnen uw MDM-oplossing.
MDM werkt anders in domeingerichte architecturen vanwege hun gedistribueerde aard. Consistentie is moeilijker te bereiken omdat u afhankelijk bent van MDM binnen uw domeinen.
Een manier om consistentie te bereiken is door uw domeinen te vragen om te voldoen aan centraal beheerde hoofdgegevens bij het distribueren van gegevensproducten. U kunt een lijst met hoofdgegevens publiceren in een hoofdgegevensarchief of centrale opslagplaats. Uw domein kan gegevens classificeren met behulp van de ondernemingsreferentie-id's van uw ondernemingsreferentiegegevens bij het distribueren van gegevensproducten over andere domeinen. Hierdoor kunnen uw andere domeinen snel alle hoofdgegevens binnen deze gegevensproducten herkennen.
U kunt ook nieuwe MDM-domeinen maken bij het groeperen van uw MDM-activiteiten en het gebruik van een hoofdgegevensarchief als een gecentraliseerde opslagplaats. Elk nieuw MDM-domein moet een specifiek gegevensonderwerp bevatten waarop de identificatie en controle van uw hoofdgegevens zich richten. Enkele bekende voorbeelden van deze gegevens zijn klanten, producten, werknemers, geografische locaties en financiële en risicogegevens. Gemasterde gegevens van deze MDM-domeinen moeten hun weg terugvinden naar andere domeinen. Deze distributie van gegevens is vergelijkbaar met de distributie van uw gegevensproducten.
U kunt het beheer van hoofdgegevens bepalen en verschillende benaderingen voor gegevensproductdistributie toestaan. Binnen de grenzen van een bepaald bereik hoeven gegevensproducten niet te voldoen aan de hoofdgegevens van het bedrijf, maar buiten de grenzen van het bereik moeten gegevensproducten voldoen. U kunt dit patroon ook omgekeerd toepassen, waarbij naleving van mastergegevens alleen binnen een specifiek bereik is vereist en niet buiten het bereik. In deze instellingen worden uw hoofdgegevens centraal beheerd in uw MDM-oplossing. Uw domeinen moeten hoofdgegevens uitwisselen, zodat ze weten welke lokale gegevens moeten worden toegewezen aan centrale hoofdgegevens. Identificeer en onderhoud deze relaties, zodat u weet welke gegevens zijn gemasterd en welke gegevens u snel aan elkaar kunt koppelen. Als een lokale domeinsleutels in een operationeel systeem worden gewijzigd, is een hoofd-id het enige element dat alles met elkaar verbindt.
Wanneer u master-id's distribueert, moet u uw MDM-hoofd-id's niet extrapoleren naar alle bronsystemen. Dit kan consistentieproblemen veroorzaken. Alleen uw toepassingen of systemen die onder MDM vallen, moeten een hoofd-id verkrijgen van uw MDM-hub. Systemen die niet onder MDM vallen, moeten hun eigen lokale integriteit (domein) gebruiken.
Hoofdgegevensbeheer op domeinniveau
Wanneer u zoekt naar overlappende gegevens, zult u waarschijnlijk verschillende overlappingsgraden ontdekken. Sommige gegevens zijn algemeen en omvatten veel domeinen. Andere gegevens hebben een beperkte overlap en beslaan slechts enkele domeinen. Onderscheid maken tussen de mate van gegevensoverlap en het belang ervan door MDM uit te breiden naar MDM op domeinniveau. U kunt dit doen door gedeeltelijke weergaven van uw hoofdgegevens binnen een specifiek bereik te maken. Dit is handig wanneer uw gegevens worden gedeeld tussen sommige, maar niet alle domeinen.
Het is belangrijk dat overlappende domeinen gegevens beheren, maar geen centrale afhankelijkheid hebben. MDM-oplossingen kunnen u hierbij helpen. U kunt het gebruik enorm vereenvoudigen door infrastructuur weg te abstraheren en MDM als een service aan uw domeinen te leveren. Als u een centrale oplossing gebruikt, past u gescheiden weergaven toe voor elk afzonderlijk domein of bereik.
Consistentie bereiken met herbruikbare onderdelen
Code delen is een andere manier om de samenwerking en hergebruik van hoofdgegevens te garanderen. In plaats van hoofdgegevens te delen, deelt u de onderliggende code (fragmenten en scripts) om uitvoer te genereren en effectief hergebruik te bevorderen. Sla deze onderliggende code op in een centrale opslagplaats en open de opslagplaats met versiebeheer. Uw teams kunnen allemaal bijdragen aan en verbeteren van code die zich in deze opslagplaats bevindt.
In dit model past u alleen bedrijfslogica toe binnen domeinen. Uw teams kunnen afwijken, verbeteringen aanbrengen of enigszins geoptimaliseerde versies van de logica gebruiken zoals ze passen. U kunt uw uitvoer opnieuw genereren wanneer verbeteringen van uw community worden toegevoegd aan uw centrale codeopslagplaats.
Houd er rekening mee dat het mogelijk is dat uw teams hun code kunnen wijzigen, waardoor het vergelijken van resultaten tussen verschillende teams moeilijker wordt, wat de consistentie kan beïnvloeden.
Overzicht van hoofdgegevensbeheer
Gebruikers kunnen alleen juiste beslissingen nemen als de gegevens die ze gebruiken consistent en correct zijn. Met MDM kunt u de consistentie en kwaliteit van uw gegevens garanderen op ondernemingsniveau.
Uw organisatie moet het juiste saldo voor MDM vinden. Het hebben van te veel gebieden van hoofdgegevens of referentiewaarden leidt tot te veel uitlijning tussen domeinen. Als u helemaal geen bedrijfsgegevens hebt, is het onmogelijk om resultaten te vergelijken. Een praktische manier om MDM op een evenwichtige manier te gebruiken, is door een opslagplaats te implementeren. Dit is de eenvoudigste manier om de hoofdgegevens van uw organisatie te beheren. Met een opslagplaats hoeft u uw domeinsystemen niet aan te passen om te leren welke gegevens van lage kwaliteit zijn of moeten worden uitgelijnd. Met een opslagplaats waarmee u die informatie kunt verkrijgen, kunt u sneller waarde leveren.
Nadat u een opslagplaats hebt geïmplementeerd, moet u een duidelijk bereik bepalen. Val niet in de val van een eenwording van zakelijke gegevens door alle gegevens te selecteren. Alleen hoofdgegevens uit uw belangrijkste velden. Selecteer eerst onderwerpen die de meeste waarde toevoegen, zoals klanten, contracten, producten en organisatie-eenheden. Uw aantal kenmerken moet in de tienduizenden staan, niet de honderden of duizenden.
Stem uw processen en governance af nadat u tot een overeenkomst met uw domeinen bent gekomen. Maak afspraken over tijdlijnen en beoordelingen duidelijk voor alle domeinen. Zorg er ook voor dat u aan uw metagegevens werkt. Catalogiseer uw hoofdgegevens. Zorg ervoor dat uw domeinen weten welke gegevenselementen kandidaten zijn van welke bronsystemen en hoe deze elementen door uw gegevenspijplijnen stromen.
De laatste stap, en uw ultieme doel, is co-existentie bereiken. Uw verbeteringen moeten rechtstreeks teruggaan naar uw domeinen. Dit is het moeilijkste deel van het proces, omdat u veel architectuurwijzigingen moet aanbrengen. Uw domeinen moeten correcties en verbeteringen kunnen afhandelen die worden verzonden vanuit uw centraal beheerde MDM-oplossing.