Partager via


Exigences pour la gouvernance des données

L’analyse à l’échelle du cloud vous recommande de prendre en compte les exigences suivantes en matière de gouvernance des données :

  • Définition des entités de données pour créer un vocabulaire métier commun dans un glossaire métier. Les entités de données dans ce contexte désignent des concepts tels que client, fournisseur, matériaux, employé, et autres.
  • Identification et détection des entités de données.
  • Classification des données pour régir la sécurité d’accès aux données, ainsi que la confidentialité et la conservation des données.
  • Des personnes, par exemple les propriétaires de données responsables de la gouvernance et des gestionnaires de données responsables de la protection et de la qualité des données.
  • Processus de gouvernance des données.
  • Gestion du cycle de vie des données pour régir la durée pendant laquelle les données doivent être conservées
  • Stratégies et règles permettant de définir le mode de gouvernance des données tout au long de leur cycle de vie.
  • Application de la stratégie aux magasins de données dans le paysage des données distribuées.
  • La gestion des données maîtres permet de rendre les données cohérentes entre les systèmes opérationnels et analytiques, comme les clients, les produits et les fournisseurs.
  • Traçabilité des métadonnées pour comprendre la transformation et la relation des entités de données.
  • Technologie permettant de régir les données structurées, multistructurées et non structurées. La gouvernance peut s’étendre sur le centre de données, plusieurs clouds et en périphérie.

L’un des défis est que les données sont collectées et stockées à plusieurs emplacement dans l’entreprise. Les données peuvent inclure des données collectées et stockées dans différentes zones géographiques et des juridictions compétentes différentes. Par conséquent, une législation différente peut s’appliquer pour la gouvernance des mêmes données dans des juridictions différentes. Découvrez les données distribuées sur plusieurs clouds et emplacements géographiques, pour :

  • Comprendre ce que sont les attributs de données, les entités de données et les relations de données dans le paysage des données distribuées.
  • Classer les données pour savoir comment les régir
  • Définir des stratégies pour spécifier la façon dont les données doivent être régies pour chaque type de classification de données et de gestion de cycle de vie.
  • Appliquer des stratégies de qualité des données, de sécurité d’accès aux données, de confidentialité des données et de gestion de cycle de vie dans le paysage des données distribuées.

Classification des données

La classification des données est une méthode de catégorisation des actifs de données en attribuant des étiquettes ou des classes logiques uniques aux actifs de données. La classification est basée sur le contexte métier des données.

Il doit exister un moyen de classer les données pour comprendre leur niveau de confidentialité et leur durée de conservation. La classification requiert les éléments suivants :

  • Schéma de classification de la confidentialité des données
  • Schéma de classification de la conservation des données

Schéma de classification de la confidentialité des données

classification ; Description
Public Tous les utilisateurs peuvent accéder aux données. Elles peuvent être envoyées à tout le monde. Par exemple, des données gouvernementales publiques.
À usage interne uniquement Seuls les employés peuvent accéder aux données. Elles ne peuvent pas être envoyées à des personnes hors de l’entreprise.
Confidentiel Les données peuvent être partagées uniquement si elles sont nécessaires pour une tâche spécifique. Les données ne peuvent pas être envoyées à des personnes hors de l’entreprise sans accord de confidentialité.
Sensible (données personnelles) Les données contiennent des informations privées qui doivent être masquées et partagées uniquement quand cela est nécessaire et pour une durée limitée. Les données ne peuvent pas être envoyées au personnel non autorisé ni à des personnes externes à l’entreprise.
Limitées Les données peuvent être partagées uniquement avec des personnes nommées qui sont responsables de leur protection. Par exemple, des documents juridiques ou des secrets commerciaux.

Schéma de classification de la conservation du cycle de vie des données

Rétention Description
None Les données peuvent être modifiées à tout moment.
Temporaire Conservez les données pendant une courte période. Par exemple, conservez les données Twitter pendant une semaine.
Période fixe Conservez les données pendant un certain nombre d’années, après quoi elles peuvent être supprimées. Par exemple, conservez les dossiers fiscaux pendant sept ans pour respecter les lois gouvernementales.
Permanent Ne supprimez jamais les données. Par exemple, la correspondance juridique.

Il est nécessaire d’automatiser le processus de classification de la confidentialité et de la conservation du cycle de vie des données à l’aide des classes définies dans chaque schéma pour étiqueter les données de manière cohérente dans le paysage des données distribuées. L’automatisation permet une gouvernance cohérente et correcte. Définissez ensuite des règles et des stratégies pour chaque classe dans le schéma de classification pour spécifier la manière dont les données doivent être régies en fonction de leur classification.

Rôles et responsabilités pour la gouvernance des données

Une autre exigence est de définir la responsabilité. Autrement, une certaine confusion peut régner quant à la responsabilité de la gouvernance des données. Si aucune responsabilité n’est définie, comment répondre aux questions suivantes ?

  • Qui définit les métriques de réussite et supervise le bon fonctionnement du programme de gouvernance des données ?
  • Qui sont les propriétaires de données ?
  • Qui définit et gère un glossaire métier ?
  • Qui crée et gère les stratégies concernant la sécurité d’accès ?
  • Qui protège la confidentialité des données personnelles à des fins de conformité ?
  • Qui surveille la qualité des données du produit sur l’ensemble des brochures et des sites web partenaires ?
  • Qui garantit la cohérence des données client dans tous les systèmes ?
  • Qui surveille l’utilisation des données d’abonnement externe par rapport à la licence ?
  • Qui contrôle les utilisateurs privilégiés tels que les administrateurs de bases de données et les scientifiques des données ?
  • S’agit-il d’un cadre supérieur ? S’agit-il d’un chef de service ?
  • S’agit-il du responsable Gouvernance, risque et conformité ?
  • Qu’en est-il du service juridique ?
  • Est-ce la responsabilité de l’informatique ?

Les rôles et responsabilités sont nécessaires pour éviter toute confusion et pour définir les bases permettant de matérialiser une culture des données.

Processus de gouvernance des données

Des processus sont nécessaires, ainsi que les rôles et les responsabilités pour :

  • Régir la définition et la maintenance d’un vocabulaire métier commun
  • Découvrir et identifier les données dont vous disposez, ce qu’elles signifient et où elles sont stockées
  • Classer les données pour savoir comment les régir
  • Régir la définition et la maintenance des stratégies de sécurité d’accès aux données
  • Régir la définition et la maintenance des stratégies de sécurité de confidentialité des données
  • Détecter les problèmes de qualité des données et les corriger
  • Appliquer des stratégies pour s’assurer que des mesures sont prises à des fins de conformité
  • Gérer la maintenance des données de référence

Stratégies et règles de gouvernance des données

Définir des stratégies et des règles pour la gouvernance :

  • Règles d’intégrité des données
  • Stratégies et règles d’ingestion des données
  • Stratégies et règles de sécurité d’accès aux données
  • Règles et stratégies de confidentialité des données
  • Règles et stratégies de qualité des données
  • Stratégies et règles de maintenance des données
  • Stratégies et règles de conservation des données

Associez ces stratégies et règles à chaque classe dans les schémas de classification de gouvernance des données.

Gestion des données de référence

Une autre exigence en matière de gestion des données est la gestion des données de référence. Les données de référence sont les données les plus largement partagées dans toutes les organisations. Elles incluent les entités de données de base. Les entités de données de base incluent Client, Fournisseur, Matériaux, Employé et Ressource. On y trouve également le graphique financier des données de comptes qui se trouvent dans différentes applications financières. Étant donné que les données maîtres sont largement partagées, elles sont indépendantes des applications. Ces données sont requises par les applications de traitement des transactions opérationnelles et les systèmes analytiques. Garantir la synchronisation de ces données permet de résoudre un grand nombre d’erreurs de données et de processus. L’idéal est d’effectuer une maintenance de manière centralisée via un processus commun et de synchroniser l’ensemble des systèmes qui en ont besoin. En outre, il est nécessaire de régir les personnes autorisées à réaliser la maintenance, ainsi que l’emplacement de celle-ci.

Il en va de même pour les données de référence comme les jeux de code et les données des marchés financiers. Dans ce cas, la normalisation et la synchronisation des jeux de code sont connues sous le nom de gestion des données de référence, qui constitue également une exigence.

Traçabilité des métadonnées

Enfin, le lignage des métadonnées constitue une exigence. Vous pouvez utiliser une piste d’audit pour savoir d’où proviennent les données et comment elles ont été transformées lors de leur transit vers un rapport ou un magasin de données. Vous pouvez utiliser des métadonnées pour rechercher l’utilisateur ou le système qui effectue la maintenance des données, ainsi que le moment et l’endroit où elle a lieu.

Résumé des éléments nécessaires pour la gouvernance des données de bout en bout

Vous avez besoin d’une solution de bout en bout qui peut régir les données tout au long de leur cycle de vie dans les magasins de données en périphérie, dans plusieurs clouds et dans le centre de données.

Diagramme de l’infrastructure de gouvernance des données.

Votre solution de gouvernance des données doit comprendre plusieurs éléments :

  • Une vision et une stratégie de gouvernance des données
  • Les données elles-mêmes, par exemple les données client, les données fournisseur, les données de commande, etc.
  • Le cycle de vie des données, de la création à la destruction, pendant lequel les données doivent être gouvernées.
  • Rôles et responsabilités pour la gouvernance des données (personnes).
  • Processus et activités de gouvernance des données ainsi que la manière dont ils s’appliquent au cycle de vie des données.
  • Stratégies et règles de gouvernance des données à différents stades du cycle de vie.
  • Technologies de gouvernance des données pour rendre possible la gouvernance des données.

Étapes suivantes