Inclure une procédure stockée de transformation de données dans un pipeline

Effectué

L’encapsulation d’une instruction CREATE EXTERNAL TABLE AS SELECT (CETAS) dans une procédure stockée vous permet d’opérationnaliser plus facilement les transformations de données que vous pouvez être amené à effectuer de manière répétée. Dans Azure Synapse Analytics et Azure Data Factory, vous pouvez créer des pipelines qui se connectent à des services liés, dont des comptes de stockage Azure Data Lake Store Gen2 qui hébergent des fichiers de lac de données, et des pools SQL serverless. Cela vous permet d’appeler vos procédures stockées dans le cadre d’un pipeline global d’extraction, de transformation et de chargement (ETL) de données.

Par exemple, vous pouvez créer un pipeline incluant les activités suivantes :

  • Activité Supprimer qui supprime le dossier cible pour les données transformées dans le lac de données, la cas échéant.
  • Activité Procédure stockée qui se connecte à votre pool SQL serverless et exécute la procédure stockée qui encapsule votre opération CETAS.

Capture d’écran montrant un pipeline contenant une activité Supprimer et une activité Procédure stockée.

La création d’un pipeline pour la transformation de données vous permet de planifier l’exécution de l’opération à des heures spécifiques ou en fonction d’événements spécifiques (tels que l’ajout de fichiers à l’emplacement de stockage source).

Conseil

Pour plus d’informations sur l’utilisation de l’activité Procédure stockée dans un pipeline, consultez Transformer des données à l’aide de l’activité Procédure stockée SQL Server dans Azure Data Factory ou Synapse Analytics dans la documentation Azure Data Factory.