Partager via


Tutoriel : Ingérer des données dans un entrepôt

S'applique à :✅ Entrepôt dans Microsoft Fabric

Dans ce tutoriel, découvrez comment ingérer des données à partir de Microsoft Azure Storage dans un entrepôt pour créer des tables.

Remarque

Ce tutoriel fait partie d’un scénario de bout en bout. Pour suivre ce didacticiel, vous devez d’abord suivre ces didacticiels :

  1. Créer un espace de travail
  2. créer un entrepôt

Ingérer des données

Dans cette tâche, découvrez comment ingérer des données dans l’entrepôt pour créer des tables.

  1. Vérifiez que l’espace de travail que vous avez créé dans le premier didacticiel est ouvert.

  2. Dans le volet d’accueil de l’espace de travail, sélectionnez + Nouvel élément pour afficher la liste complète des types d’éléments disponibles.

  3. Dans la liste, dans la section Obtenir des données, sélectionnez l'élément de type pipeline de données.

  4. Dans la fenêtre Nouveau pipeline, dans la zone Nom, entrez Load Customer Data.

    Capture d’écran de la boîte de dialogue Nouveau pipeline, mettant en surbrillance le nom entré.

  5. Pour approvisionner le pipeline, sélectionnez Créer. La configuration est terminée lorsque la page d'accueil Construire un pipeline de données s'affiche.

  6. Dans la page d'accueil du pipeline de données, sélectionnez Activité du pipeline.

    Capture d’écran de la page d’accueil Créer un pipeline de données, mettant en évidence l’option d’activité de pipeline.

  7. Dans le menu, dans la section Déplacer et transformer, sélectionnez Copier des données.

    Capture d’écran de la section Déplacer et transformer, montrant où sélectionner Copier des données.

  8. Dans le canevas de conception de pipeline, sélectionnez l'activité Copier les données.

    Capture d’écran des données de copie situées sur le canevas de conception.

  9. Pour configurer l’activité, dans la page Général, dans la zone Nom , remplacez le texte par défaut par .

    Capture d’écran de l’onglet Général, montrant où entrer le nom de l’activité de copie.

  10. Dans la page Source, dans la liste déroulante Connexion, sélectionnez Autres pour afficher toutes les sources de données disponibles, y compris celles dans le catalogue OneLake .

  11. Sélectionnez + Nouveau pour créer une source de données.

  12. Recherchez, puis sélectionnez, Blobs Azure.

  13. Dans la page Connecter la source de données, dans la zone Nom du compte ou URL, entrez https://fabrictutorialdata.blob.core.windows.net/sampledata/.

  14. Notez que la liste déroulante Nom de connexion est automatiquement renseignée et que le type d’authentification est défini sur anonyme.

    Capture d’écran de la fenêtre Se connecter à la source de données montrant tous les paramètres terminés.

  15. Sélectionnez Connecter.

  16. Dans la page Source, pour accéder aux fichiers Parquet dans la source de données, complétez les paramètres suivants :

    1. Dans les zones Chemin d’accès au fichier, entrez :

      1. chemin d’accès au fichier - Conteneur :sampledata

      2. File path - Directory : WideWorldImportersDW/tables

      3. File path - File name : dimension_customer.parquet

    2. Dans la liste déroulante Format de fichier, sélectionnez Parquet.

  17. Pour afficher un aperçu des données et tester qu’il n’existe aucune erreur, sélectionnez aperçu des données.

    Capture d’écran de la page Source, mettant en évidence les modifications apportées aux étapes précédentes et la fonction aperçu des données.

  18. Dans la page Destination, dans la liste déroulante Connexion, sélectionnez l’entrepôtWide World Importers.

  19. Pour l’option Table, sélectionnez l'option Créer automatiquement une table.

  20. Dans la première zone Table, insérez dbo.

  21. Dans la deuxième case, entrez dimension_customer.

    Capture d’écran de la page Destination, mettant en évidence les modifications effectuées lors des étapes précédentes.

  22. Dans le ruban Accueil, sélectionnez Exécuter.

  23. Dans la boîte de dialogue Enregistrer et exécuter ?, sélectionnez Enregistrer et exécuter pour que le pipeline charge la table dimension_customer.

    Capture d’écran de la boîte de dialogue Enregistrer et exécuter, en mettant en surbrillance le bouton Enregistrer et exécuter.

  24. Pour surveiller la progression de l’activité de copie, passez en revue les activités d'exécution du pipeline sur la page Sortie (attendez qu'elle se termine avec un état terminé avec succès).

    Capture d’écran de la page Sortie, mettant en évidence l’état Réussi.

Étape suivante