Gouverner les données dans Microsoft Fabric

Effectué

Microsoft Fabric inclut certaines fonctionnalités de gouvernance de base qui peuvent être suffisantes pour les besoins de certaines organisations.

Dans votre entreprise de soins de santé, vous avez des besoins précis en matière de gouvernance des données, car la législation dans certains de vos territoires est très stricte, mais vous ne voulez pas engager de dépenses inutiles. Vous souhaitez évaluer les fonctionnalités de gouvernance des données dans Microsoft Fabric pour savoir si elles répondent vos besoins.

Dans cette unité, examinons les fonctionnalités de gouvernance de Fabric.

Présentation de Microsoft Fabric

Diagramme montrant l’architecture de Microsoft Fabric sous une forme simplifiée.

Fabric est la plateforme d’analyse et de données de bout en bout de Microsoft. La plateforme SaaS (Software-as-a-Service) peut stocker, déplacer, traiter, ingérer, transformer et analyser vos données, quels que soient leur taille et leur format actuel. Étant donné que Fabric intègre en toute transparence vos données, vous n’avez plus besoin d’interfacer des solutions provenant de différents fournisseurs et utilisant divers protocoles. Une fois que vous avez des données à l’emplacement et au format voulus, les fonctionnalités de business intelligence avancées peuvent les analyser et générer des informations qui vous aideront à prendre des décisions. Toutes les fonctionnalités et outils Fabric sont pris en charge avec l’intégration de l’IA, ce qui accélère votre productivité.

Remarque

Microsoft Fabric inclut des fonctionnalités précédemment disponibles séparément dans Power BI, Azure Synapse Analytics et Azure Data Factory, ainsi que de nouvelles fonctionnalités.

Expériences Fabric

Fabric inclut diverses expériences pour répondre à tous vos besoins en matière de manipulation et d’analyse des données :

  • Data Factory : Utilisez cette expérience pour ingérer, préparer et transformer des données à partir de nombreuses sources différentes via différents connecteurs de données.
  • Engineering données Synapse : Cette expérience est une plateforme Spark que vous pouvez utiliser pour collecter, stocker, traiter et analyser de vastes volumes de données par le biais de travaux planifiés et de notebooks.
  • Entrepôt de données Synapse : Utilisez cette expérience pour séparer le calcul du stockage et mettre à l’échelle chacun d’entre eux de manière indépendante. Les données sont stockées au format Data Lake démontrent une performance SQL de premier plan.
  • Science des données Synapse : Utilisez cette expérience pour entraîner, déployer et utiliser des modèles Machine Learning.
  • Real-Time Intelligence : Cette expérience est une solution complète pour les données pilotées par les événements, telles que la télémétrie des appareils, les journaux de données et les données de diffusion en continu.
  • Power BI : Utilisez cette expérience pour visualiser, examiner et découvrir les tendances masquées dans vos données. Vous pouvez partager des rapports Power BI pour faciliter la prise de décision.
  • Data Activator : Utilisez cette expérience pour spécifier des actions, telles que des e-mails et des flux de travail, qui se lancent lorsque des conditions spécifiques sont remplies dans vos données. Vous pouvez créer ces actions sans écrire de code.

OneLake

Dans Fabric, toutes les informations sont stockées dans un lac de données, qui peut contenir des données structurées et non structurées. L’implémentation de Microsoft du lac de données est appelée OneLake et repose sur Azure Data Lake Storage (ADLS) génération 2. Ce mécanisme de stockage sous-jacent unique permet d’éliminer les silos et de réduire les coûts tout en garantissant que les stratégies et la sécurité sont appliquées universellement.

Qu’est-ce que la gouvernance des données ?

Les données que votre organisation possède et traite sont souvent critiques et hautement sensibles. Pour la plupart des entreprises, il est essentiel que les données soient conservées en toute sécurité, facilement accessibles et traitées conformément à la législation en vigueur dans tous les territoires où elles opèrent.

La gouvernance des données est un terme qui décrit les stratégies et pratiques que vous utilisez pour garantir la qualité, la cohérence, la sécurité et la facilité d’utilisation de vos données. Cette discipline englobe une gamme d’activités et de responsabilités qui gèrent efficacement les données tout au long de leur cycle de vie.

Un programme de gouvernance des données inclut généralement les éléments suivants :

  • Audit : Enregistrement de l’origine des données et des personnes qui les modifient
  • Évaluation : Évaluation de l’utilité et de la précision de vos données
  • Documentation : Description de la nature de vos données à des personnes qui peuvent les utiliser
  • Gestion : Suppression des données inexactes, réponse aux demandes d’accès, respect de la législation sur les données
  • Protection : Sécurisation des données contre l’accès non autorisé, les ransomwares et d’autres attaques

Des données bien gouvernées sont fiables et facilement accessibles aux bonnes personnes.

Conseil

Les grandes organisations ont souvent des données divisées en silos. Les systèmes et bases de données historiques, possédés par des unités distinctes au sein de votre entreprise, imposent des obstacles à des fins de sécurité qui entravent l’accès. Dans ces cas, l’intégration des données et la suppression des silos de données, tout en maintenant la sécurité, est un élément essentiel de la gouvernance des données.

Un régime solide de gouvernance des données peut apporter à votre entreprise des avantages, tels que :

  • Une source unique de vérité qui réduit la confusion et favorise une bonne prise de décision.
  • Des données de qualité supérieure qui reflètent le monde qu’elles mesurent plus précisément.
  • Une conformité plus rapide avec les demandes d’accès.
  • Une réduction des coûts pour le stockage et la gestion des données.

Fonctionnalités de gouvernance des données dans Microsoft Fabric

Vous pouvez effectuer de nombreuses tâches de gouvernance des données dans Fabric, directement et sans abonnement supplémentaire à Microsoft Purview. Examinons certaines des fonctionnalités disponibles :

Gestion du paysage de données

Le paysage de données de votre organisation est l’ensemble de ses ressources de données. Il faut du temps pour maintenir et gérer les grands paysages de données. Fabric peut aider cette tâche avec ces outils :

  • Le portail d’administration Fabric : contrôler les paramètres du locataire, les capacités, les domaines et d’autres objets, généralement réservés aux administrateurs.
  • Locataires, domaines et espaces de travail : conteneurs logiques que vous pouvez utiliser pour contrôler l’accès aux données et fonctionnalités. Les administrateurs Fabric, par exemple, doivent avoir accès à tous les paramètres du locataire, tandis que les contrôleurs de données au niveau de l’équipe peuvent uniquement avoir le contrôle des paramètres sur leur domaine ou leur espace de travail.
    • Les domaines regroupent les données qui sont pertinentes pour un seul secteur d’activité ou un seul sujet.
    • Les espaces de travail regroupent les éléments Fabric utilisés par une seule équipe ou un seul service.
  • Capacités : Ces objets limitent l’utilisation des ressources de calcul pour toutes les charges de travail Fabric.
  • Analyse des métadonnées : L’analyse extrait des valeurs telles que les noms, les identités, les sensibilités, les approbations, etc. à partir de lacs de données. Vous pouvez utiliser ces métadonnées pour analyser et définir des stratégies de gouvernance.

Sécurisation et protection des données

Les données sécurisées sont protégées contre les attaques non autorisées et destructrices. Elles sont également conformes aux réglementations de stockage des données applicables dans votre région. Fabric inclut les outils utiles suivants :

  • Balises des données : Utilisez des balises pour identifier la sensibilité des données et appliquer des stratégies de conservation et de protection des données.
  • Rôles d’espace de travail : Utilisez des rôles pour définir les utilisateurs autorisés à accéder aux données dans un espace de travail.
  • Contrôles au niveau des données : Utilisez des contrôles au niveau des éléments Fabric tels que les tables, les lignes et les colonnes pour imposer des restrictions granulaires.
  • Certifications : Fabric est conforme à de nombreuses certifications de gestion des données, notamment HIPAA BAA, ISO/IEC 27017, ISO/IEC 27018, ISO/IEC 27001 et ISO/IEC 27701.

Encourager la recherche et l’utilisation des données

Les données sont utiles uniquement si les utilisateurs peuvent les localiser et les analyser. Ces fonctionnalités de Fabric peuvent encourager l’utilisation des données :

  • Hub de données OneLake : Cet outil facilite la recherche et l’exploration des données dans votre paysage.
  • Approbation : Les utilisateurs approuvent un élément Fabric afin d’en garantir la qualité. Les approbations aident d’autres utilisateurs à approuver les données contenues dans l’élément.
  • Traçabilité des données : Cette fonctionnalité permet aux utilisateurs de comprendre le flux de données entre les éléments d’un espace de travail et l’impact qu’une modification aurait.

Supervision de l’utilisation des données

Fabric permet aux utilisateurs de surveiller la façon dont les informations sont utilisées :

  • Hub de supervision : Ce hub montre ce qu’il est advenu des éléments Fabric. Vous voyez uniquement les activités des éléments Fabric que vous avez le droit de consulter.
  • Métriques de capacité : Utilisez l’application Métriques de capacité pour surveiller l’utilisation et la consommation.

En savoir plus