Gérer les données de référence dans le maillage de données
Les entreprises utilisant une architecture de maillage de données ont souvent un grand nombre de domaines, chacun contenant des systèmes et des données uniques.
Cette large propagation des données rend les opérations plus complexes, car plusieurs versions des mêmes données peuvent exister dans cette configuration. L’intégration nécessite davantage d’efforts, car les propriétaires doivent intégrer et harmoniser toutes les différentes parties des mêmes données à partir de plusieurs domaines. Les données peuvent être incohérentes dans les contextes entre ces différents domaines. La qualité des données peut également varier. Appliquez la gestion des données de référence (MDM) pour relever ces défis.
Gestion des données de référence orientée domaine
Les numéros d’identification de référence sont un aspect important de votre MDM. Vos numéros d’identification de références relient les données et les données de référence de vos domaines. Ces numéros sont essentiels à votre capacité à suivre les données qui ont été contrôlées et les données qui doivent être rassemblées. Vous ne pouvez identifier que des données uniques et attribuer des numéros d’identification de référence de manière centralisée, et non localement au sein d’un système. Vos données de référence provenant de différents systèmes doivent être regroupées dans votre solution MDM.
La gestion des données de référence fonctionne différemment dans les architectures orientées domaine en raison de leur nature distribuée. La cohérence est plus difficile à obtenir, car vous vous appuyez sur la gestion des données de référence au sein de vos domaines.
Une façon d’obtenir une cohérence consiste à demander à vos domaines de se conformer aux données de référence gérées de manière centralisée lors de la distribution des produits de données. Vous pouvez publier une liste de données de référence dans un magasin de données de référence ou un référentiel central. Votre domaine peut classifier les données à l’aide des identificateurs de référence d’entreprise de vos données de référence d’entreprise lors de la distribution des produits de données dans d’autres domaines. Cela permet à vos autres domaines de reconnaître rapidement les données de référence dans ces produits de données.
Vous pouvez également créer de nouveaux domaines MDM lors du regroupement de vos activités MDM et utiliser un magasin de données de référence en tant que référentiel centralisé. Chaque nouveau domaine MDM doit contenir un sujet de données spécifique sur lequel l’identification et le contrôle de vos données de référence se concentrent. Certains exemples connus de ces données incluent des clients, des produits, des employés, des emplacements géographiques et des informations sur les risques et les finances. Les données contrôlées de ces domaines MDM doivent trouver leur chemin vers d’autres domaines. Cette distribution de données est similaire à la distribution de vos produits de données.
Vous pouvez étendre la gestion des données de référence et autoriser différentes approches de distribution des produits de données. Dans les limites d’une certaine étendue, les produits de données n’ont pas à se conformer aux données de référence d’entreprise, mais au-delà des limites de l’étendue, les produits de données doivent être conformes. Vous pouvez également appliquer ce modèle à l’envers, cela nécessite l’adhésion aux données de référence uniquement dans une étendue spécifique et non en dehors de celle-ci. Dans ces configurations, vos données contrôlées sont gérées de manière centralisée dans votre solution MDM. Vos domaines doivent échanger des données de référence afin qu’ils sachent quelles données locales doivent être mappées aux données de référence centrales. Identifiez et conservez ces relations afin de savoir quelles données ont été contrôlées et celles que vous pouvez associer rapidement. Si des clés de domaine locales dans un système opérationnel changent, un identificateur de référence est le seul élément qui lie tout ensemble.
Lorsque vous distribuez des identificateurs de référence, n’extrapolez pas vos identificateurs de référence MDM à tous les systèmes sources. Si vous le faîtes, des problèmes de cohérence surviendront. Seules vos applications ou systèmes soumis à MDM doivent obtenir un identificateur de référence à partir de votre hub MDM. Les systèmes qui ne sont pas soumis à MDM doivent utiliser leur propre intégrité locale (domaine).
Gestion des données de référence au niveau du domaine
Lorsque vous recherchez des données qui se chevauchent, vous découvrirez probablement différents degrés de chevauchement. Certaines données sont génériques et couvrent de nombreux domaines. D’autres données ont des chevauchements limités et ne couvrent que quelques domaines. Distinguez la quantité de chevauchements des données et son importance en étendant MDM au niveau du domaine. Vous pouvez le faire en créant des vues partielles de vos données de référence dans une étendue spécifique. Cela est utile lorsque vos données sont partagées entre certains domaines, mais pas tous.
Il est important que les domaines qui se chevauchent gèrent les données, mais n’ont aucune dépendance centrale. Les solutions MDM peuvent vous aider à y parvenir. Vous pouvez considérablement simplifier l’utilisation en abstrayant l’infrastructure et en fournissant MDM en tant que service à vos domaines. Si vous utilisez une solution centrale, appliquez des vues séparées pour chaque domaine ou étendue individuel.
Obtenir une cohérence avec des composants réutilisables
Le partage de code est un autre moyen de garantir la collaboration et la réutilisation des données de référence. Au lieu de partager des données de référence, vous partagez le code sous-jacent (extraits de code et scripts) pour générer des sorties et promouvoir une réutilisation efficace. Stockez ce code sous-jacent dans un référentiel central et ouvert avec contrôle de version. Vos équipes peuvent tous contribuer et améliorer le code qui vit dans ce référentiel.
Dans ce modèle, vous appliquez la logique métier uniquement dans les domaines. Vos équipes peuvent s’écarter, apporter des améliorations ou utiliser des versions légèrement optimisées de la logique comme elles l’entendent. Vous pouvez régénérer vos sorties en tant qu’améliorations apportées à votre communauté dans votre référentiel de code central.
Notez qu’autoriser vos équipes à modifier leur code peut complexifier la comparaison des résultats entre différentes équipes, ce qui peut avoir un impact sur la cohérence.
Résumé de la gestion des données de référence
Les utilisateurs peuvent uniquement prendre des décisions correctes si les données qu’ils utilisent sont cohérentes et correctes. En utilisant MDM, vous pouvez garantir la cohérence et la qualité de vos données au niveau de l’entreprise.
Votre organisation doit trouver le bon équilibre pour la gestion des données de référence. L’utilisation de trop de zones de données de référence ou de valeurs de référence entraîne un alignement inter-domaines trop important. L’absence de données d’entreprise rend impossible la comparaison des résultats. Un moyen pratique de commencer à utiliser MDM de manière équilibrée consiste à implémenter un référentiel. Il s’agit du moyen le plus simple de gérer les données de référence de votre organisation. Avec un référentiel, vous n’avez pas besoin d’ajuster vos systèmes de domaine pour découvrir quelles données sont de mauvaise qualité ou doivent être alignées. Avec un référentiel qui vous aide à obtenir ces informations, vous pouvez fournir une valeur plus rapidement.
Après avoir implémenté un référentiel, vous devez décrire une étendue claire. Ne tombez pas dans le piège de l’unification des données d’entreprise en sélectionnant toutes les données. Seules les données de référence de vos champs les plus importants. Commencez par sélectionner des sujets qui ajoutent la plus grande valeur, comme les clients, les contrats, les produits et les unités organisationnelles. Votre nombre d’attributs doit se trouver dans les dizaines, et non les centaines ou milliers.
Alignez vos processus et votre gouvernance une fois que vous êtes arrivé à un accord avec vos domaines. Effectuez des accords sur les chronologies et les révisions claires pour tous les domaines. Veillez également à travailler sur vos métadonnées. Cataloguez vos données de référence. Assurez-vous que vos domaines savent quels éléments de données sont candidats à partir des systèmes sources et comment ces éléments circulent via vos pipelines de données.
La dernière étape, et votre objectif ultime, est d’atteindre la coexistence. Vos améliorations doivent revenir directement à vos domaines. Il s’agit de la partie la plus difficile du processus, car elle vous oblige à apporter de nombreuses modifications d’architecture. Vos domaines doivent être en mesure de gérer les corrections et les améliorations envoyées à partir de votre solution MDM gérée de manière centralisée.