Partage via


Transformer les données en exécutant un notebook

L'activité Notebook en pipeline vous permet d'exécuter Notebook créé dans Microsoft Fabric. Vous pouvez créer une activité Notebook directement via l'interface utilisateur Fabric. Cet article fournit une procédure pas à pas qui décrit comment créer une activité Notebook à l'aide de l'interface utilisateur de Data Factory.

Ajouter une activité Notebook à un pipeline

Cette section décrit comment utiliser une activité Notebook dans un pipeline.

Prérequis

Pour commencer, vous devez remplir les conditions préalables suivantes :

Création de l'activité

  1. Créez un nouveau pipeline dans votre espace de travail.

  2. Recherchez Notebook dans le volet Activités du pipeline et sélectionnez-le pour l'ajouter au canevas du pipeline.

    Capture d'écran de l'interface utilisateur Fabric avec le volet Activités et l'activité Notebook en surbrillance.

  3. Sélectionnez la nouvelle activité Notebook sur le canevas si elle n'est pas déjà sélectionnée.

    Capture d'écran montrant l'onglet Paramètres généraux de l'activité Notebook.

Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .

Paramètres du notebook

Sélectionnez l'onglet Paramètres, sélectionnez un Notebook existant dans la liste déroulante Bloc-notes et spécifiez éventuellement les paramètres à transmettre au bloc-notes.

Capture d'écran montrant l'onglet Paramètres du notebook mettant en évidence l'onglet, où choisir un notebook et où ajouter des paramètres.

Balise de session

Pour réduire le temps nécessaire à l’exécution de votre travail de bloc-notes, vous pourriez éventuellement définir une balise de session. La définition de la balise de session demande à Spark de réutiliser une session Spark existante réduisant ainsi le temps de démarrage. Toute valeur de chaîne arbitraire peut être utilisée pour la balise de session. Si aucune session n’existe, une nouvelle session est créée à l’aide de la valeur de balise.

Capture d’écran montrant l’onglet Paramètres du bloc-notes mettant en surbrillance l’onglet où il convient d’ajouter une balise de session.

Remarque

Pour pouvoir utiliser la balise de session, le mode haute concurrence pour le pipeline exécutant plusieurs blocs-notes doit être activé. Cette option se trouve sous le mode haute concurrence pour les paramètres Spark dans les paramètres de l’espace de travail

Capture d’écran montrant l’onglet Paramètres de l’espace de travail mettant en surbrillance l’onglet, où il convient d’activer le mode d’accès concurrentiel élevé pour les pipelines exécutant plusieurs notebooks.

Enregistrer et exécuter ou planifier le pipeline

Basculez vers l'onglet Accueil en haut de l'éditeur de pipeline et sélectionnez le bouton Enregistrer pour enregistrer votre pipeline. Sélectionnez Exécuter pour l'exécuter directement ou Planifier pour le planifier. Vous pouvez également afficher l'historique d'exécution ici ou configurer d'autres paramètres.

Capture d'écran montrant l'onglet Accueil dans l'éditeur de pipeline avec le nom de l'onglet, les boutons Enregistrer, Exécuter et Planifier en surbrillance.