Partager via


Module 1 : Créer un pipeline avec Data Factory

Ce module prend 10 minutes, ingérer des données brutes du magasin source dans la table Bronze d’un lakehouse de données à l’aide de la activité Copy dans un pipeline.

Les étapes générales du module 1 sont les suivantes :

  1. Créez un pipeline de données.
  2. Utilisez une activité de copie dans le pipeline pour charger des exemples de données dans un lakehouse de données.

Créer un pipeline de données

  1. Un compte de locataire Microsoft Fabric avec un abonnement actif est requis. Créer un compte gratuit.

  2. Vérifiez que vous disposez d’un espace de travail microsoft Fabric activé : Créer un espace de travail.

  3. Connectez-vous à Power BI.

  4. Sélectionnez l’icône Power BI par défaut en bas à gauche de l’écran, puis basculez vers l’expérience de Data Factory.

    Capture d’écran montrant la sélection de l’expérience Data Factory.

  5. Sélectionnez Pipeline de données et fournissez un nom de pipeline. Sélectionnez ensuite Créer.

    Capture d’écran de la page de démarrage de Data Factory avec le bouton pour créer un pipeline de données sélectionné.

    Capture d’écran montrant la boîte de dialogue pour donner un nom au nouveau pipeline.

Utilisez une activité de copie dans le pipeline pour charger des données d'exemple dans un entrepôt de données.

Étape 1 : Utilisez l’Assistant copie pour configurer une activité de copie.

Sélectionnez Assistant de copie de données pour ouvrir l’outil de l’assistant de copie.

Capture d’écran montrant la sélection de l’activité Copier des données à partir de la nouvelle page de démarrage du pipeline.

Étape 2 : Configurer vos paramètres dans l’Assistant de copie.

  1. La boîte de dialogue Copier des données s’affiche à la première étape, Choisir la source de données, surlignée. Sélectionnez Exemple de données dans les options situées en haut de la boîte de dialogue, puis sélectionnez NYC Taxi - Green.

    Capture d’écran montrant la sélection des données NYC Taxi - Vert dans l'assistant de copie sous l’onglet Choisir une source de données.

  2. L’aperçu de la source de données apparaît ensuite sur la page Se connecter à la source de données. Révisez, puis sélectionnez suivant.

    Capture d’écran montrant les données d’aperçu pour l’exemple de jeu de données NyC Taxi - Green.

  3. Pour l’étape Choisir la destination des données de l’assistant Copy, sélectionnez Lakehouse, puis Suivant.

    Capture d’écran montrant la sélection de la destination Lakehouse sous l’onglet Choisir la destination des données de l’Assistant Copie de données.

  4. Sélectionnez Créer un Lakehouse dans la page de configuration de destination de données qui s’affiche, puis entrez un nom pour le nouveau Lakehouse. Sélectionnez ensuite Suivant encore.

    Capture d’écran montrant la page de configuration de la destination des données de l’assistant de copie, lors du choix de l’option Créer un nouveau Lakehouse et en fournissant un nom pour le Lakehouse.

  5. Configurez maintenant les détails de votre destination Lakehouse dans la page Sélectionner et mapper le chemin d’accès ou la table du dossier. Sélectionnez Tables pour le dossier racine , fournissez un nom de table et choisissez l’action Remplacer. Ne cochez pas la case Activer la partition qui s’affiche après avoir sélectionné l’action Remplacer la table.

    Capture d’écran montrant l’onglet Se connecter à la destination des données de l’Assistant Copier des données, à l’étape Sélectionner et mapper au chemin d’accès au dossier ou à la table.

  6. Enfin, dans la page Vérifier + enregistrer de l’assistant de copie des données, passez en revue la configuration. Pour ce didacticiel, décochez la case à cocher Démarrer le transfert des données immédiatement, car nous exécutons l’opération manuellement à l’étape suivante. Sélectionnez ensuite OK.

    Capture d’écran montrant l’Assistant Copier des données dans la page Vérifier + enregistrer.

Étape 3 : Exécutez et affichez les résultats de votre activité de copie.

  1. Sélectionnez l’onglet Exécuter dans l’éditeur de pipeline. Sélectionnez ensuite le bouton Exécuter, puis Enregistrez et exécutez à l’invite pour exécuter l’activité Copy.

    Capture d’écran montrant l’onglet Exécution du pipeline avec le bouton Exécuter mis en surbrillance.

    Capture d’écran montrant la boîte de dialogue Enregistrer et exécuter avec le bouton Enregistrer et exécuter mis en surbrillance.

  2. Vous pouvez superviser l’exécution, puis vérifier les résultats sous l’onglet Sortie sous le canevas du pipeline. Sélectionnez le bouton Détails de l'exécution (icône « lunettes » qui s'affiche lorsque vous pointez sur le pipeline en cours) pour afficher les détails de l'exécution.

    Capture d’écran montrant le bouton Détails d'exécution sous l’onglet Sortie du pipeline.

  3. Les détails de l’exécution montrent 1 508 501 lignes lues et écrites.

    Capture d’écran des détails de copie des données pour l’exécution du pipeline.

  4. Développez la section Répartition des durées pour afficher la durée de chaque étape de l’activité Copy. Après avoir examiné les détails de la copie, sélectionnez Fermer.

    Capture d’écran montrant la répartition de la durée de l’exécution de l’activité de copie.

Dans ce premier module de notre didacticiel de bout en bout pour votre première intégration de données à l’aide de Data Factory dans Microsoft Fabric, vous avez appris à :

  • Créez un pipeline de données.
  • Ajoutez une activité Copy à votre pipeline.
  • Utilisez des exemples de données et créez un data Lakehouse pour stocker les données dans une nouvelle table.
  • Exécutez le pipeline et affichez ses détails et sa répartition de la durée.

Passez à la section suivante pour créer votre dataflow.