Partager via


Démarrage rapide : Bien démarrer avec Azure Data Factory

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, l’aide à la décision et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Bienvenue dans Azure Data Factory ! Cet article de démarrage vous permet de créer votre première fabrique de données et votre premier pipeline en 5 minutes. Le modèle ARM ci-dessous crée et configure tout ce dont vous avez besoin pour l’essai. Vous devez ensuite accéder à votre fabrique de données de démo et effectuer un clic de plus pour déclencher le pipeline, ce qui déplace des exemples de données d’un stockage blob Azure vers un autre.

Prérequis

Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.

Résumé de la vidéo

La vidéo suivante présente un aperçu de l’échantillon :

Essayer votre première démo en un clic

Dans votre premier scénario de démo, vous utilisez l’activité Copy dans une fabrique de données pour copier un blob Azure nommé moviesDB2.csv à partir d’un dossier d’entrée sur un stockage blob Azure dans un dossier de sortie. Dans un scénario réel, cette opération de copie peut se faire entre les nombreux récepteurs et sources de données pris en charge disponibles dans le service. Elle peut également impliquer des transformations de données.

Essayez maintenant en un clic ! Après avoir cliqué sur le bouton ci-dessous, les objets suivants sont créés dans Azure :

  • Un compte Data Factory
  • Un pipeline dans la fabrique de données avec une activité Copy
  • Un stockage blob Azure avec moviesDB2.csv chargé dans un dossier d’entrée qui est la source
  • Un service lié pour connecter la fabrique de données au stockage blob Azure

Étape 1 : Cliquer sur le bouton pour démarrer

Sélectionnez le bouton ci-dessous pour l’essayer ! (Si vous avez déjà cliqué sur le bouton au-dessus, vous n’avez pas besoin de le refaire.)

Essayer votre première démo de fabrique de données

Vous êtes redirigé vers la page de configuration affichée dans l’image ci-dessous pour déployer le modèle. Ici, vous devez uniquement créer un groupe de ressources. (Vous pouvez laisser toutes les autres valeurs par défaut.) Cliquez ensuite sur Vérifier + créer, puis sur Créer pour déployer les ressources.

Notes

L’utilisateur qui déploie le modèle doit attribuer un rôle à une identité managée. Cela nécessite des autorisations qui peuvent être accordées avec les rôles Propriétaire, Administrateur de l’accès utilisateur ou Opérateur d’identité managée.

Toutes les ressources référencées ci-dessus sont créées dans le nouveau groupe de ressources, ce qui vous permet de les nettoyer facilement après avoir essayé la démo.

Capture d’écran de la boîte de dialogue de création du modèle de déploiement.

Étape 2 : Vérifier les ressources déployées

  1. Sélectionnez Accéder au groupe de ressources une fois le déploiement effectué. Capture d’écran de la page Déploiement effectué dans le portail Azure après le déploiement du modèle.

  2. Dans le groupe de ressources, vous voyez la nouvelle fabrique de données, le compte de stockage blob Azure et l’identité managée qui ont été créés par le déploiement. Capture d’écran du contenu du groupe de ressources créé pour la démo.

  3. Sélectionnez la fabrique de données dans le groupe de ressources pour la voir. Sélectionnez ensuite le bouton Lancement de Studio pour continuer. Capture d’écran du portail Azure dans la page de la fabrique de données nouvellement créée, avec, en surbrillance, l’emplacement du bouton Ouvrir Azure Data Factory Studio.

  4. Sélectionnez l’onglet Auteuronglet Auteur, puis le Pipeline créé par le modèle. Vérifiez ensuite les données sources en sélectionnant Ouvrir.

    Capture d’écran d’Azure Data Factory Studio montrant le pipeline créé par le modèle.

  5. Dans le jeu de données source que vous voyez, sélectionnez Parcourir et notez le fichier moviesDB2.csv, qui a déjà été chargé dans le dossier d’entrée.

    Capture d’écran du jeu de données source avec, en surbrillance, le bouton Parcourir qui permet à l’utilisateur de voir le fichier d’entrée créé pour la démo.

    Capture d’écran du contenu du dossier d’entrée montrant le fichier moviesDB2.csv utilisé dans la démo.

Étape 3 : Déclencher le pipeline de démo à exécuter

  1. Sélectionnez Ajouter un déclencheur, puis Déclencher maintenant. Capture d’écran du bouton Déclencher maintenant pour le pipeline de la démo.
  2. Dans le volet droit, sous Exécuter le pipeline, sélectionnez OK.

Surveiller le pipeline

  1. Sélectionnez l’onglet Monitoreronglet Moniteur.

  2. Vous pouvez voir une vue d’ensemble de vos exécutions de pipeline sous l’onglet Monitorer, comme l’heure de début de l’exécution, son état, etc.

    Capture d’écran de l’onglet de monitoring de la fabrique de données.

  3. Dans ce guide de démarrage rapide, le pipeline a un seul type d’activité : Copy. Cliquez sur le nom du pipeline pour voir les détails des résultats d’exécution de l’activité Copy.

    Capture d’écran des résultats d’exécution d’une activité Copy sous l’onglet de monitoring de la fabrique de données.

  4. Cliquez sur les détails pour afficher le processus de copie détaillé. À partir des résultats, la taille des données lues et écrites est identique, et 1 fichier a été lu et écrit, ce qui prouve également que toutes les données ont été copiées dans la destination.

    Capture d’écran des résultats détaillés de l’exécution de l’activité Copy.

Nettoyer les ressources

Vous pouvez nettoyer toutes les ressources que vous avez créées dans ce guide de démarrage rapide de deux manières. Vous pouvez supprimer tout le groupe de ressources Azure qui comprend toutes les ressources qui y ont été créées. Sinon, si vous voulez garder certaines ressources intactes, accédez au groupe de ressources et supprimez uniquement les ressources spécifiques de votre choix, en conservant les autres. Par exemple, si vous utilisez ce modèle pour créer une fabrique de données utilisée dans un autre tutoriel, vous pouvez supprimer les autres ressources et garder uniquement la fabrique de données.

Dans ce guide de démarrage rapide, vous avez créé une fabrique de données Azure contenant un pipeline avec une activité Copy. Pour en savoir plus sur Azure Data Factory, consultez l’article et le module Learn ci-dessous.