Combiner des fichiers CSV
Dans Power Query, vous pouvez combiner plusieurs fichiers à partir d’une source de données donnée. Cet article décrit le fonctionnement de l’expérience lorsque les fichiers que vous souhaitez combiner sont des fichiers CSV. Informations supplémentaires : Vue d’ensemble de la combinaison de fichiers
Conseil
Vous pouvez suivre cet exemple en téléchargeant les exemples de fichiers utilisés dans cet article à partir de ce lien de téléchargement. Vous pouvez placer ces fichiers dans la source de données de votre choix, comme un dossier local, un dossier SharePoint, un stockage Blob Azure, Azure Data Lake Storage ou une autre source de données qui fournit la vue du système de fichiers.
Par souci de simplicité, l’exemple de cet article utilise le connecteur Dossier. Plus d’informations : Dossier
À propos des exemples de fichiers utilisés
Pour combiner des fichiers, il est impératif qu’ils aient toutes la même structure et la même extension. Tous les fichiers utilisés dans cet exemple ont la même structure et l’extension (.csv).
Il existe 12 fichiers CSV, un pour chaque mois de l’année civile 2019. L’image suivante montre les 15 premières lignes du fichier pour le mois de janvier.
Le nombre de lignes varie d’un fichier à l’autre, mais tous les fichiers ont une section d’en-tête dans les quatre premières lignes. Ils ont des en-têtes de colonne dans la cinquième ligne, et les données de la table commencent dans la sixième ligne et continuent à travers toutes les lignes suivantes.
L’objectif est de combiner tous les 12 fichiers dans une table unique. Ce tableau combiné contient la ligne d’en-tête située en haut de la table et inclut le nom source, la date, le pays, les unités et les données de revenus pour l’année entière dans des colonnes distinctes après la ligne d’en-tête.
Aperçu du tableau
Lorsque vous vous connectez au dossier qui héberge les fichiers que vous souhaitez combiner ( dans cet exemple, le nom de ce dossier est fichiers CSV), vous voyez la boîte de dialogue d’aperçu du tableau, qui affiche le chemin d’accès de votre dossier dans le coin supérieur gauche. L’aperçu des données affiche la vue du système de fichiers.
Pour cet exemple, sélectionnez Combiner. Pour Excel ou Power Query Desktop, sélectionnez Combiner & Transformer des données.
Note
Dans une autre situation, vous pouvez sélectionner Transformer des données pour filtrer et transformer vos données avant de combiner les fichiers. La sélection de Combiner n’est recommandée que lorsque vous êtes certain que le dossier contient uniquement les fichiers que vous souhaitez combiner.
Boîte de dialogue Combiner des fichiers
Une fois que vous avez sélectionné Combiner dans l’aperçu du tableau, la boîte de dialogue Combiner des fichiers s’affiche.
Note
Power Query détecte automatiquement le connecteur à utiliser en fonction du premier fichier trouvé dans la liste. Pour en savoir plus sur le connecteur CSV, accédez à Texte/CSV.
Pour cet exemple, conservez tous les paramètres par défaut (Exemple de fichier défini sur premier fichier, ainsi que les valeurs par défaut pour origine de fichier, délimiteur et détection de type de données).
À présent, sélectionnez Transformer des données dans le coin inférieur droit pour accéder à la requête de sortie.
Requête de sortie
Après avoir sélectionné Transformer des données dans la boîte de dialogue Combiner des fichiers, vous revenez à l’Éditeur Power Query dans la requête que vous avez créée initialement à partir de la connexion au dossier local. La requête de sortie contient désormais le nom du fichier source dans la colonne la plus à gauche, ainsi que les données de chacun des fichiers sources dans les colonnes restantes.
Toutefois, les données ne sont pas dans la forme correcte. Vous devez supprimer les quatre premières lignes de chaque fichier avant de les combiner. Pour apporter cette modification à chaque fichier avant de les combiner, sélectionnez la requête Transformer l’exemple de fichier dans le volet Requêtes sur le côté gauche de votre écran.
Modifier la requête du fichier d'exemple de transformation
Dans cette requête de l’exemple de fichier Transformer, les valeurs de la colonne Date indiquent que les données concernent le mois d’avril, qui est au format année-mois-jour (AAAA-MM-DD). Avril 2019.csv est le premier fichier affiché dans la préversion du tableau.
Vous devez maintenant appliquer un nouvel ensemble de transformations pour nettoyer les données. Chaque transformation est automatiquement convertie en fonction à l’intérieur du groupe Requêtes d’assistance qui est appliquée à chaque fichier du dossier avant de combiner les données de chaque fichier.
Les transformations à ajouter dans la requête du fichier exemple Transform sont les suivantes :
Supprimer les lignes supérieures: pour effectuer cette opération, sélectionnez le menu de l’icône de tableau dans le coin supérieur gauche du tableau, puis sélectionnez Supprimer les lignes supérieures.
Dans la boîte de dialogue Supprimer les lignes supérieures, entrez 4, puis sélectionnez OK.
Une fois que vous avez sélectionné OK, votre table n’a plus les quatre premières lignes.
Utiliser la première ligne en tant qu’en-têtes: sélectionnez à nouveau l’icône de tableau, puis sélectionnez Utiliser la première ligne comme en-têtes.
Le résultat de cette opération promeut la première ligne de la table en nouveaux en-têtes de colonne.
Une fois cette opération terminée, Power Query tente par défaut de détecter automatiquement les types de données des colonnes et d’ajouter une nouvelle étape Type de colonne modifié.
Révision de la requête de sortie
Lorsque vous revenez à la requête fichiers CSV dans Power Query Desktop, la dernière étape vous donne une erreur qui indique « La colonne « Colonne1 » de la table n’a pas été trouvée. Lorsque vous revenez à fichier CSV requête dans Power Query Online, les modifications que vous avez apportées précédemment pour supprimer les quatre premières lignes et utiliser la première ligne en tant qu’en-têtes ne sont pas appliqués à la table. Dans Power Query Online, sélectionnez Actualiser dans l’onglet Accueil. Une fois l’écran actualisé, le même message d’erreur s’affiche.
La raison de cette erreur est que l’état précédent de la requête effectuait une opération sur une colonne nommée Column1. Toutefois, en raison des modifications apportées à l'exemple de fichier Transform dans la requête, cette colonne n'existe plus. Plus d’informations : Gérer les erreurs dans Power Query
Vous pouvez supprimer cette dernière étape de la requête dans le volet Étapes appliquées en sélectionnant l’icône de suppression X sur le côté gauche du nom de l’étape. Après avoir supprimé cette étape, votre requête affiche les résultats corrects.
Toutefois, notez qu’aucune des colonnes dérivées des fichiers (Date, Country, Units, Revenue) n’a un type de données spécifique qui leur est attribué. Affectez le type de données correct à chaque colonne à l’aide du tableau suivant.
Nom de colonne | Type de données |
---|---|
Date | Date |
Pays | Texte |
Unités | Nombre entier |
Revenu | Monnaie |
Après avoir défini les types de données pour chaque colonne, vous êtes prêt à charger la table.
Note
Pour savoir comment définir ou modifier des types de données de colonne, accédez à types de données.
Vérification
Pour vérifier que tous les fichiers sont combinés, vous pouvez sélectionner l’icône de filtre sur l’en-tête de colonne Source.Name, qui affiche tous les noms des fichiers combinés. Si vous recevez l’avertissement « Liste peut être incomplète », sélectionnez Charger plus de en bas du menu pour afficher des valeurs plus disponibles dans la colonne.
Une fois que vous avez sélectionné Charger plus de, tous les noms de fichiers disponibles sont affichés.