Module 1 : Créer un pipeline avec Data Factory
Ce module prend 10 minutes, ingérer des données brutes du magasin source dans la table Bronze d’un lakehouse de données à l’aide de la activité Copy dans un pipeline.
Les étapes générales du module 1 sont les suivantes :
- Créez un pipeline de données.
- Utilisez une activité de copie dans le pipeline pour charger des exemples de données dans un lakehouse de données.
Créer un pipeline de données
Un compte de locataire Microsoft Fabric avec un abonnement actif est requis. Créer un compte gratuit.
Vérifiez que vous disposez d’un espace de travail microsoft Fabric activé : Créer un espace de travail.
Sélectionnez l’icône Power BI par défaut en bas à gauche de l’écran, puis basculez vers l’expérience de Data Factory.
Sélectionnez Pipeline de données et fournissez un nom de pipeline. Sélectionnez ensuite Créer.
Utilisez une activité de copie dans le pipeline pour charger des données d'exemple dans un entrepôt de données.
Étape 1 : Utilisez l’Assistant copie pour configurer une activité de copie.
Sélectionnez Assistant de copie de données pour ouvrir l’outil de l’assistant de copie.
Étape 2 : Configurer vos paramètres dans l’Assistant de copie.
La boîte de dialogue Copier des données s’affiche à la première étape, Choisir la source de données, surlignée. Sélectionnez Exemple de données dans les options situées en haut de la boîte de dialogue, puis sélectionnez NYC Taxi - Green.
L’aperçu de la source de données apparaît ensuite sur la page Se connecter à la source de données. Révisez, puis sélectionnez suivant.
Pour l’étape Choisir la destination des données de l’assistant Copy, sélectionnez Lakehouse, puis Suivant.
Sélectionnez Créer un Lakehouse dans la page de configuration de destination de données qui s’affiche, puis entrez un nom pour le nouveau Lakehouse. Sélectionnez ensuite Suivant encore.
Configurez maintenant les détails de votre destination Lakehouse dans la page Sélectionner et mapper le chemin d’accès ou la table du dossier. Sélectionnez Tables pour le dossier racine , fournissez un nom de table et choisissez l’action Remplacer. Ne cochez pas la case Activer la partition qui s’affiche après avoir sélectionné l’action Remplacer la table.
Enfin, dans la page Vérifier + enregistrer de l’assistant de copie des données, passez en revue la configuration. Pour ce didacticiel, décochez la case à cocher Démarrer le transfert des données immédiatement, car nous exécutons l’opération manuellement à l’étape suivante. Sélectionnez ensuite OK.
Étape 3 : Exécutez et affichez les résultats de votre activité de copie.
Sélectionnez l’onglet Exécuter dans l’éditeur de pipeline. Sélectionnez ensuite le bouton Exécuter, puis Enregistrez et exécutez à l’invite pour exécuter l’activité Copy.
Vous pouvez superviser l’exécution, puis vérifier les résultats sous l’onglet Sortie sous le canevas du pipeline. Sélectionnez le bouton Détails de l'exécution (icône « lunettes » qui s'affiche lorsque vous pointez sur le pipeline en cours) pour afficher les détails de l'exécution.
Les détails de l’exécution montrent 1 508 501 lignes lues et écrites.
Développez la section Répartition des durées pour afficher la durée de chaque étape de l’activité Copy. Après avoir examiné les détails de la copie, sélectionnez Fermer.
Contenu connexe
Dans ce premier module de notre didacticiel de bout en bout pour votre première intégration de données à l’aide de Data Factory dans Microsoft Fabric, vous avez appris à :
- Créez un pipeline de données.
- Ajoutez une activité Copy à votre pipeline.
- Utilisez des exemples de données et créez un data Lakehouse pour stocker les données dans une nouvelle table.
- Exécutez le pipeline et affichez ses détails et sa répartition de la durée.
Passez à la section suivante pour créer votre dataflow.