Explorer le lakehouse Microsoft Fabric

Effectué

Un lakehouse se présente sous la forme d'une base de données et s'appuie sur un lac de données à l'aide de tables au format Delta. Les lakehouses combinent les fonctionnalités analytiques basées sur SQL d’un entrepôt de données relationnelles à la flexibilité et la scalabilité d’un lac de données. Les lakehouses stockent tous les formats de données et peuvent être utilisés avec différents outils d’analytique et langages de programmation. En tant que solutions basées sur le cloud, les lakehouses peut être mis à l’échelle automatiquement et fournir une haute disponibilité et une reprise d’activité après sinistre.

Diagramme d’un lakehouse affichant la structure du dossier d’un lac de données, ainsi que les capacités relationnelles d’un entrepôt de données.

Voici quelques-uns des avantages des lakehouses :

  • Les lakehouses utilisent des moteurs Spark et SQL pour traiter des données à grande échelle, et prennent en charge le Machine Learning ou l’analytique de modélisation prédictive.
  • Les données des lakehouses sont organisées dans un format de schéma de lecture, ce qui signifie que vous définissez le schéma en fonction des besoins plutôt que d’avoir un schéma prédéfini.
  • Les lakehouses prennent en charge les transactions ACID (Atomicité, Cohérence, Isolation, Durabilité) par le biais de tables au format Delta Lake à des fins de cohérence et d’intégrité des données.
  • Les lakehouses constituent un emplacement unique où les ingénieurs données, les scientifiques des données et les analystes de données peuvent accéder aux données et les utiliser.

Si vous souhaitez une solution analytique évolutive qui préserve la cohérence des données, vous pouvez opter pour un lakehouse. Il est important d’évaluer vos besoins spécifiques afin de déterminer la solution la mieux adaptée.

Charger des données dans un lakehouse

Les lakehouses Fabric sont un élément central de votre solution d’analyse. Vous pouvez suivre le processus ETL (extraction, transformation et chargement) pour ingérer et transformer des données avant de les charger dans le lakehouse.

Vous pouvez ingérer des données dans de nombreux formats courants à partir de diverses sources, notamment des fichiers locaux, des bases de données ou des API. Vous pouvez également créer des raccourcis Fabric vers des données dans des sources externes comme Azure Data Lake Store Gen2 ou OneLake. Utilisez l’Explorateur de lakehouses pour parcourir les fichiers, les dossiers, les raccourcis et les tables et afficher leur contenu au sein de la plateforme Fabric.

Vous pouvez transformer les données ingérées, puis les charger en utilisant Apache Spark avec des notebooks ou des flux de données Gen2. Utilisez des pipelines Data Factory pour orchestrer vos différentes activités ETL et placer les données préparées dans votre lakehouse.

Remarque

Les flux de données Gen2 sont basés sur Power Query, un outil familier des analystes de données utilisant Excel ou Power BI qui fournit une représentation visuelle des transformations comme alternative à la programmation traditionnelle.

Vous pouvez utiliser votre lakehouse pour de nombreuses raisons, notamment :

  • Analyser des données avec SQL.
  • Entraîner des modèles Machine Learning
  • Effectuer des analyses sur des données en temps réel.
  • Développer des rapports dans Power BI.

Sélectionner un lakehouse

L’accès au lakehouse est géré via l’espace de travail ou le partage au niveau des éléments. Vous devez utiliser des rôles d’espace de travail pour les collaborateurs, car ces rôles permettent d’accéder à tous les éléments de l’espace de travail. Le partage au niveau des éléments est idéal pour accorder un accès en lecture seule, par exemple à des fins d’analyse ou de développement de rapports Power BI.

Les lakehouses Fabric prennent également en charge les fonctionnalités de gouvernance des données, notamment les étiquettes de confidentialité, et peuvent être étendus à l’aide de Microsoft Purview avec votre locataire Fabric.

Remarque

Pour plus d’informations, consultez la documentation Sécurité dans Microsoft Fabric.