Qu’est-ce qu’un lakehouse dans Microsoft Fabric ?
Microsoft Fabric Lakehouse est une plateforme d’architecture de données permettant de stocker, de gérer et d’analyser des données structurées et non structurées dans un emplacement unique. Il s’agit d’une solution flexible et évolutive qui permet aux organisations de gérer de grands volumes de données à l’aide de divers outils et infrastructures pour traiter et analyser ces données. Il s’intègre à d’autres outils de gestion et d’analytique des données pour fournir une solution complète pour l’ingénierie et l’analytique des données. Un lakehouse combine l’extensibilité d’un lac de données avec les performances et la structure d’un entrepôt de données, fournissant une plateforme unifiée pour le stockage, la gestion et l’analytique des données.
Point de terminaison d'analyse SQL pour Lakehouse
Lakehouse crée une couche de service en générant automatiquement un point de terminaison d’analytique SQL et un modèle sémantique par défaut lors de la création. Cette nouvelle fonctionnalité semi-transparente permet à l’utilisateur de travailler directement sur les tables Delta dans le lac pour fournir une expérience fluide et performante, de l’ingestion des données à la création de rapports.
Il est important de noter que le point de terminaison d’analytique SQL est une expérience en lecture seule qui ne prend pas en charge la surface d’exposition T-SQL complète d’un entrepôt de données transactionnelles.
Remarque
Seules les tables au format Delta sont disponibles dans le point de terminaison d’analyse SQL. Vous ne pouvez pas interroger les formats Parquet, CSV et autres à l’aide du point de terminaison d’analytique SQL. Si vous ne voyez pas votre tableau, vous devez le convertir au format Delta.
Détection et inscription automatiques des tables
La découverte et l'enregistrement automatiques de tables constituent une fonctionnalité de Lakehouse qui offre une expérience entièrement gérée allant du fichier à la table pour les ingénieurs et les scientifiques des données. Vous pouvez supprimer un fichier dans la zone gérée de Lakehouse et le système le valide automatiquement pour les formats structurés pris en charge et l’inscrit dans le metastore avec les métadonnées nécessaires, telles que les noms de colonnes, les formats, la compression, etc. (Actuellement, le seul format pris en charge est la table Delta.) Vous pouvez ensuite référencer le fichier en tant que table et utiliser la syntaxe SparkSQL pour interagir avec les données.
Interagir avec l’élément Lakehouse
Un ingénieur données peut interagir avec le lakehouse et les données dans le lakehouse de plusieurs façons :
Explorateur Lakehouse : l’explorateur est la page d’interaction Lakehouse principale. Vous pouvez charger des données dans votre Lakehouse, explorer des données dans votre Lakehouse à l’aide de l’Explorateur d’objets, définir des étiquettes MIP & ainsi que faire diverses autres choses. En savoir plus sur l’expérience de l’explorateur : Naviguer dans l’explorateur Fabric Lakehouse.
Notebooks: Les ingénieurs de données peuvent utiliser le notebook pour écrire du code permettant de lire, de transformer et d'écrire directement dans le Lakehouse en tant que tables et/ou dossiers. Vous pouvez en savoir plus sur l’utilisation de notebooks pour Lakehouse : Explorer les données dans votre lakehouse avec un notebook et Comment utiliser un notebook pour charger des données dans votre lakehouse.
Pipelines : les ingénieurs données peuvent utiliser des outils d’intégration de données tels que l’outil de copie de pipeline pour extraire des données d’autres sources et atterrir dans le Lakehouse. Pour plus d’informations sur l’utilisation de l’activité de copie, consultez Comment copier des données à l’aide de l’activité de copie.
définitions de travaux Apache Spark: les ingénieurs données peuvent développer des applications robustes et orchestrer l’exécution de travaux Spark compilés en Java, Scala et Python. En savoir plus sur les travaux Spark : Qu’est-ce qu’une définition de travail Apache Spark ?
Dataflows Gen 2: les ingénieurs données peuvent utiliser Dataflows Gen 2 pour ingérer et préparer leurs données. Pour plus d’informations sur le chargement des données à l’aide de dataflows, Créez votre premier dataflow pour obtenir et transformer des données.
En savoir plus sur les différentes façons de charger des données dans votre lakehouse : Options pour obtenir des données dans Fabric Lakehouse.
Multitâche avec lakehouse
L’expérience multitâche offre une conception d’onglets de navigateur qui vous permet d’ouvrir et de basculer entre plusieurs éléments de manière transparente, ce qui vous permet de gérer votre data lakehouse plus efficacement que jamais. Plus besoin de jongler entre différentes fenêtres ni de perte du suivi de vos tâches. Lakehouse offre une expérience multitâche améliorée pour rendre votre parcours de gestion des données aussi efficace et convivial que possible avec les fonctionnalités suivantes :
Conserver les opérations en cours d’exécution : Vous pouvez charger ou exécuter l’opération de chargement des données dans un onglet et vérifier une autre tâche dans un autre onglet. Avec la multi-tâche améliorée, les opérations en cours d’exécution ne sont pas annulées lorsque vous naviguez entre les onglets. Vous pouvez vous concentrer sur votre travail sans interruption.
Conserver votre contexte : objets sélectionnés, les tables de données ou les fichiers restent ouverts et facilement disponibles lorsque vous basculez entre les onglets. Le contexte de votre data lakehouse est toujours à portée de main.
Rechargement de liste non bloquant : un mécanisme de rechargement non bloquant pour vos listes de fichiers et de tables. Vous pouvez continuer à travailler pendant que la liste se met à jour en arrière-plan. Il garantit que vous disposez des données les plus récentes tout en vous offrant une expérience fluide et ininterrompue.
Notifications clairement définies : les notifications toast spécifient leur lakehouse d’origine, ce qui facilite le suivi des modifications et des mises à jour dans votre environnement multitâche.
Conception d'une maison au bord du lac accessible
L’accessibilité a toujours été une priorité absolue pour s’assurer que Lakehouse est inclusif et convivial pour tout le monde. Voici les principales initiatives que nous avons implémentées jusqu’à présent pour prendre en charge l’accessibilité :
compatibilité des lecteurs d’écran : Vous pouvez travailler en toute transparence avec les lecteurs d’écran populaires, ce qui permet aux utilisateurs malvoyants de naviguer et d’interagir efficacement avec notre plateforme.
Recréation de texte Une conception réactive qui s’adapte à différentes tailles d’écran et orientations. Le texte et le contenu sont recréés dynamiquement, ce qui facilite l’affichage et l’interaction avec notre application sur divers appareils.
navigation au clavier : navigation améliorée au clavier pour permettre aux utilisateurs de traverser le lac sans compter sur une souris, ce qui améliore l’expérience des personnes souffrant de handicaps moteurs.
Texte de remplacement pour les images : Toutes les images incluent désormais un texte de remplacement descriptif, ce qui permet aux lecteurs d’écran de transmettre des informations significatives.
champs de formulaire et étiquettes : tous les champs de formulaire ont des étiquettes associées, ce qui simplifie l’entrée de données pour tous, y compris ceux qui utilisent des lecteurs d’écran.
Contenu connexe
Dans cet aperçu, vous obtiendrez une compréhension de base d’un lakehouse. Passez à l’article suivant pour découvrir comment créer et utiliser votre propre lakehouse :
- Pour commencer à utiliser lakehouses, consultez Créer un lakehouse dans Microsoft Fabric.