Introduction
Même si SQL est couramment utilisé par les analystes Données pour interroger les données et prendre en charge les charges de travail analytiques et de création de rapports, les ingénieurs Données ont souvent besoin d’utiliser SQL pour transformer les données, souvent dans le cadre d’un pipeline d’ingestion de données ou d’un processus d’extraction, de transformation et de chargement (ETL).
Dans ce module, vous allez apprendre à utiliser des instructions CREATE EXTERNAL TABLE AS SELECT
(CETAS) pour transformer des données et stocker les résultats dans un lac de données qui peuvent être interrogés via une table relationnelle dans une base de données SQL serverless ou traités directement à partir du système de fichiers.
À l’issue de ce module, vous pourrez :
- Utiliser une instruction CREATE EXTERNAL TABLE AS SELECT (CETAS) pour transformer des données.
- Encapsuler une instruction CETAS dans une procédure stockée.
- Inclure une procédure stockée de transformation de données dans un pipeline.
Prérequis
Avant de commencer ce module, vous devez disposer des compétences et des connaissances requises suivantes :
- Connaître Azure Synapse Analytics.
- Savoir utiliser Transact-SQL pour interroger et manipuler des données.