Partager via


Tutoriel Lakehouse : Créer un lakehouse, ingérer des exemples de données et générer un rapport

Dans ce tutoriel, vous allez créer un lakehouse, ingérer des exemples de données dans la table Delta, appliquer une transformation si nécessaire, puis créer des rapports. Dans ce tutoriel, vous allez découvrir comment :

  • Création d'un Lakehouse à partir de la charge de travail Ingénieurs de données
  • Télécharger et ingérer des exemples de données client
  • Ajouter des tables au modèle sémantique
  • Créer un rapport

Si vous n’avez pas de Microsoft Fabric, inscrivez-vous à une capacité d’essai gratuite.

Prérequis

Créer un lakehouse.

Dans cette section, vous allez créer un lakehouse à partir de l’expérience Ingénieurs de données.

  1. Dans Power BI, sélectionnez Espaces de travail dans le menu de gauche.

  2. Pour ouvrir votre espace de travail, entrez son nom dans la zone de texte de recherche située en haut et sélectionnez-le dans les résultats de la recherche.

  3. Dans le sélecteur situé en bas à gauche, sélectionnez Ingénieurs de données.

    Capture d’écran montrant où sélectionner le sélecteur et ingénieurs de données.

  4. Dans l’écran Ingénieurs de données, sélectionnez Lakehouse pour créer un lakehouse.

  5. Dans la boîte de dialogue Nouveau lakehouse , entrez wwilakehouse dans le champ Nom.

    Capture d'écran de la boîte de dialogue Nouveau lakehouse.

  6. Sélectionnez Créer pour créer et ouvrir le nouveau lakehouse.

Ingérer des exemples de données

Dans cette section, vous allez ingérer des exemples de données client dans le lakehouse.

Remarque

Si vous n’avez pas configuré OneDrive, inscrivez-vous à l’essai gratuit de Microsoft 365 : Essai gratuit - Essayez Microsoft 365 pendant un mois.

  1. Téléchargez le fichier dimension_customer.csv à partir du référentiel d’exemples Fabric.

  2. Dans l’onglet Accueil, sous Obtenir des données dans votre lakehouse, vous voyez les options permettant de charger des données dans le lakehouse. Sélectionnez Nouveau Dataflow Gen2.

    Capture d'écran montrant où sélectionner l'option Nouveau Dataflow Gen2 pour charger les données dans votre lakehouse.

  3. Dans l’écran Nouveau flux de données, sélectionnez Importer à partir d’un fichier Texte/CSV.

  4. Dans l’écran Se connecter à la source de données, sélectionnez le bouton radio Charger le fichier. Faites glisser et déposez le fichier dimension_customer.csv que vous avez téléchargé à l’étape 1. Une fois le fichier chargé, sélectionnez Suivant.

    Capture d'écran montrant où sélectionner Charger fichier et où faire glisser le fichier précédemment téléchargé.

  5. Dans la page Aperçu des données du fichier, affichez un aperçu des données, puis sélectionnez Créer pour continuer et revenir au canevas du flux de données.

  6. Dans le volet Paramètres de la requête, mettez à jour le champ Nom avec dimension_customer.

    Remarque

    Fabric ajoute un espace et un nombre à la fin du nom de la table par défaut. Les noms de table doivent être en minuscules et ne doivent pas contenir d’espaces. Renommez-le correctement et supprimez les espaces du nom de la table.

    Capture d'écran du volet des paramètres de la requête, montrant où saisir le nom et sélectionner la destination des données.

  7. Dans ce tutoriel, vous avez associé les données client à un lakehouse. Si vous avez d’autres éléments de données que vous souhaitez associer au lakehouse, vous pouvez les ajouter :

    1. Dans les éléments de menu, sélectionnez Ajouter une destination de données, puis lakehouse. À partir de l’écran Se connecter à la destination des données, connectez-vous à votre compte si nécessaire et sélectionnez Suivant.

    2. Accédez à la wwilakehouse de votre espace de travail.

    3. Si la table dimension_customer n’existe pas, sélectionnez le paramètre Nouvelle table et entrez le nom de la table dimension_customer. Si la table existe déjà, sélectionnez le paramètre Table existante et choisissez dimension_customer dans la liste des tables de l’Explorateur d’objets. Cliquez sur Suivant.

      Capture d'écran montrant comment choisir la table de destination.

    4. Dans le volet Choisir les paramètres de destination , sélectionnez Remplacer comme méthode Mise à jour. Sélectionnez Enregistrer les paramètres pour revenir au canevas du flux de données.

  8. À partir du canevas de flux de données, vous pouvez facilement transformer les données en fonction des besoins de votre entreprise. Par souci de simplicité, nous n’apportons aucune modification dans ce tutoriel. Pour continuer, sélectionnez Publier en bas à droite de l’écran.

    Capture d'écran du panneau de configuration de la requête qui contient le bouton Publier.

  9. Un cercle tournant en regard du nom du flux de données indique que la publication est en cours dans la vue d’élément. Une fois la publication terminée, sélectionnez ... et sélectionnez Propriétés. Renommez le flux de données en Charger la table Lakehouse et sélectionnez Enregistrer.

  10. Sélectionnez l’option Actualiser maintenant en regard du nom du flux de données pour actualiser le flux de données. Cette option exécute le flux de données et déplace les données du fichier source vers la table lakehouse. Pendant qu’il est en cours, vous voyez un cercle tournant sous colonne Actualisée dans l’affichage d’élément.

    Capture d'écran montrant où se trouve l'icône Actualiser maintenant.

  11. Une fois le flux de données actualisé, sélectionnez votre nouveau lakehouse dans la barre de navigation gauche pour afficher la table Delta dimension_customer.

    Capture d'écran du panneau de navigation à partir duquel la maison du lac est ouverte.

  12. Sélectionnez la table pour afficher un aperçu de ses données. Vous pouvez également utiliser le point de terminaison d’analytique SQL du lakehouse pour interroger les données avec des instructions SQL. Sélectionnez point de terminaison d’analytique SQL dans le menu déroulant Lakehouse en haut à droite de l’écran.

    Capture d’écran de la table Delta, montrant où sélectionner le point de terminaison de l’analytique SQL.

  13. Sélectionnez la table dimension_customer pour afficher un aperçu de ses données ou sélectionnez Nouvelle requête SQL pour écrire vos instructions SQL.

    Capture d'écran de l'écran du point final d’analytique SQL, montrant où sélectionner Nouvelle requête SQL.

  14. L’exemple de requête suivant agrège le nombre de lignes en fonction de la colonne BuyingGroup de la table dimension_customer. Les fichiers de requête SQL sont enregistrés automatiquement pour référence ultérieure, et vous pouvez renommer ou supprimer ces fichiers en fonction de vos besoins.

    Pour exécuter le script, sélectionnez l’icône Exécuter en haut du fichier de script.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Créer un rapport

Dans cette section, vous allez générer un rapport à partir des données ingérées.

  1. Auparavant, toutes les tables et vues de Lakehouse étaient automatiquement ajoutées au modèle sémantique. Avec les récentes mises à jour, pour les nouvelles maisons de lac, vous devez ajouter manuellement vos tables au modèle sémantique. Ouvrez votre lakehouse et basculez vers la vue du Point de terminaison d’analytique SQL. Dans l'onglet Reporting, sélectionnez Gérer le modèle sémantique par défaut et sélectionnez les tables que vous souhaitez ajouter au modèle sémantique. Dans ce cas, sélectionnez la table dimension_customer.

    Capture d'écran où vous pouvez sélectionner les tables à ajouter au modèle sémantique.

  2. Pour vous assurer que les tables du modèle sémantique sont toujours synchronisées, passez à la vue du point de terminaison Analytique SQL et ouvrez le volet paramètres de l'entrepôt de données. Sélectionnez Modèle sémantique Power BI par défaut et activez Synchroniser le modèle sémantique Power BI par défaut. Pour plus d’informations, consultez Modèles sémantiques Power BI par défaut.

    Capture d'écran montrant comment activer la synchronisation des données avec le modèle sémantique par défaut.

  3. Une fois la table ajoutée, Fabric crée un modèle sémantique portant le même nom que le lakehouse.

    Capture d'écran montrant le modèle sémantique par défaut qui a été créé lors de la création du nouveau lakehouse.

  4. Dans le volet de modèle sémantique, vous pouvez afficher toutes les tables. Vous disposez d’options pour créer des rapports à partir de zéro, des rapports paginés ou laisser Power BI créer automatiquement un rapport en fonction de vos données. Dans le cadre de ce tutoriel, sous Explorer ces données, sélectionnez Créer automatiquement un rapport. Dans le tutoriel suivant, nous créons un rapport à partir de zéro.

    Capture d'écran de la page Détails du modèle sémantique, montrant où sélectionner Créer un rapport.

  5. Étant donné que la table est une dimension et qu’il n’y a aucune mesure, Power BI crée une mesure pour le nombre de lignes et l’agrège sur différentes colonnes, et crée différents graphiques, comme illustré dans l’image suivante. Vous pouvez enregistrer ce rapport pour l’avenir en sélectionnant Enregistrer dans le ruban supérieur. Vous pouvez apporter d’autres modifications à ce rapport pour répondre à vos besoins en incluant ou en excluant d’autres tables ou colonnes.

    Capture d'écran d'une page de résumé rapide affichant quatre diagrammes à barres différents.

Étape suivante