Kombinování souborů CSV
V Power Query můžete zkombinovat více souborů z daného zdroje dat. Tento článek popisuje, jak funguje prostředí, když soubory, které chcete zkombinovat, jsou soubory CSV. Další informace: Kombinování souborů přehled
Spropitné
Můžete postupovat podle tohoto příkladu stažením ukázkových souborů použitých v tomto článku z tohoto odkazu ke stažení. Tyto soubory můžete umístit do zvoleného zdroje dat, jako je místní složka, složka SharePointu, úložiště objektů blob Azure, Azure Data Lake Storage nebo jiný zdroj dat, který poskytuje zobrazení systému souborů.
Pro zjednodušení používá příklad v tomto článku konektor složky. Další informace: složky
Informace o použitých ukázkových souborech
Ke kombinování souborů je nezbytné, aby všechny měly stejnou strukturu a stejnou příponu. Všechny soubory použité v tomto příkladu mají stejnou strukturu a příponu (.csv).
Existuje 12 souborů CSV, jeden pro každý měsíc kalendářního roku 2019. Následující obrázek ukazuje prvních 15 řádků souboru za měsíc leden.
Počet řádků se liší od souboru po soubor, ale všechny soubory mají v prvních čtyřech řádcích oddíl záhlaví. V pátém řádku mají záhlaví sloupců a data tabulky začínají v šestém řádku a procházejí všemi následujícími řádky.
Cílem je zkombinovat všechny 12 souborů do jedné tabulky. Tato kombinovaná tabulka obsahuje řádek záhlaví v horní části tabulky a obsahuje zdrojový název, datum, zemi, jednotky a údaje o výnosech za celý rok v samostatných sloupcích za řádkem záhlaví.
Náhled tabulky
Při připojování ke složce, která je hostitelem souborů, které chcete zkombinovat – v tomto příkladu je název této složky soubory CSV– zobrazí se dialogové okno náhledu tabulky, ve kterém se zobrazí cesta ke složce v levém horním rohu. Náhled dat zobrazuje zobrazení systému souborů.
V tomto příkladu vyberte Kombinovat. V Excelu nebo Power Query Desktopu vyberte Kombinovat & Transformace dat.
Poznámka
V jiné situaci byste mohli vybrat Transformovat data, abyste svá data dále filtrovali a transformovali před kombinováním souborů. Výběr možnosti Kombinovat se doporučuje jenom v případech, kdy jste si jistí, že složka obsahuje jenom soubory, které chcete zkombinovat.
Dialogové okno Kombinovat soubory
Po výběru Zkombinovat v náhledu tabulky se zobrazí dialogové okno Kombinovat soubory.
Poznámka
Power Query automaticky zjistí, jaký konektor se má použít, na základě prvního souboru nalezeného v seznamu. Další informace o konektoru CSV najdete v části Text/CSV.
V tomto příkladu ponechte všechna výchozí nastavení (Příklad souboru nastaven na První soubora výchozí hodnoty pro původ souboru, oddělovača detekce datových typů).
Nyní vyberte Transformovat data v pravém dolním rohu a přejděte na výstupní dotaz.
Výstupní dotaz
Po výběru Transformovat data v dialogovém okně Kombinovat soubory se vrátíte do Editoru Power Query v dotazu, který jste původně vytvořili z připojení k místní složce. Výstupní dotaz teď obsahuje název zdrojového souboru v levém sloupci spolu s daty ze všech zdrojových souborů ve zbývajících sloupcích.
Data ale nejsou ve správném tvaru. Před kombinováním těchto řádků je potřeba z každého souboru odebrat horní čtyři řádky. Chcete-li tuto změnu provést v každém souboru, než je zkombinujete, vyberte dotaz transformovat ukázkový soubor v podokně Dotazy na levé straně obrazovky.
Upravte dotaz souboru s ukázkou transformace
V tomto dotazu v ukázkovém souboru transformace hodnoty ve sloupci Date ukazují, že data jsou z dubna, který má formát rok-měsíc-den (RRRR-MM-DD). Duben 2019.csv je první soubor zobrazený v náhledu tabulky.
Teď potřebujete k vyčištění dat použít novou sadu transformací. Každá transformace se automaticky převede na funkci uvnitř skupiny pomocných dotazů a, která se použije u každého souboru ve složce před kombinací dat z každého souboru.
Transformace, které je potřeba přidat do ukázkového souboru transformací v dotazu, jsou:
Odebrat horní řádky: Chcete-li tuto operaci provést, vyberte nabídku ikony tabulky v levém horním rohu tabulky a pak vyberte Odebrat horní řádky.
V dialogovém okně Odebrat horní řádky zadejte 4a pak vyberte OK.
Jakmile vyberete OK, tabulka už nemá horní čtyři řádky.
Použít první řádek jako záhlaví: Znovu vyberte ikonu tabulky a pak vyberte Použít první řádek jako záhlaví.
Výsledek této operace propaguje první řádek tabulky na záhlaví nových sloupců.
Po dokončení této operace se Power Query ve výchozím nastavení pokusí automaticky rozpoznat datové typy sloupců a přidat nový krok Změna typu sloupce.
Revize výstupního dotazu
Když se vrátíte k dotazu souborů CSV v Power Query Desktopu, posledním krokem je chyba, která vypisuje 'sloupec „Column1“ v tabulce nebyl nalezen'. Když se vrátíte k dotazu souborů CSV z Power Query Online, změny, které jste předtím provedli pro odebrání prvních čtyř řádků a použití prvního řádku jako záhlaví, nebyly aplikovány na tabulku. V Power Query Online vyberte Aktualizovat na kartě Domů. Jakmile se obrazovka aktualizuje, zobrazí se stejná chybová zpráva.
Důvodem této chyby je, že předchozí stav dotazu prováděl operaci se sloupcem s názvem Column1. Vzhledem k změnám v ukázkovém souboru transformace dotazu už tento sloupec neexistuje. Další informace: Řešení chyb v Power Query
Tento poslední krok dotazu můžete odebrat z podokna Použitý postup výběrem ikony odstranění X na levé straně názvu kroku. Po odstranění tohoto kroku zobrazí dotaz správné výsledky.
Všimněte si však, že žádný ze sloupců odvozených ze souborů (Date, Country, Units, Revenue) nemá přiřazený konkrétní datový typ. Pomocí následující tabulky přiřaďte ke každému sloupci správný datový typ.
Název sloupce | Datový typ |
---|---|
Datum | Datum |
Země | Text |
Jednotky | Celé číslo |
Výnos | Měna |
Po definování datových typů pro každý sloupec jste připraveni načíst tabulku.
Poznámka
Pokud chcete zjistit, jak definovat nebo změnit datové typy sloupců, přejděte na Datové typy.
Ověření
Pokud chcete ověřit, že jsou všechny soubory sloučené, můžete v záhlaví sloupce Source.Name vybrat ikonu filtru, která zobrazí všechny názvy sloučených souborů. Pokud se zobrazí upozornění "Seznam může být neúplný", vyberte v dolní části nabídky možnost Načíst další, aby se ve sloupci zobrazily další dostupné hodnoty.
Po kliknutí na Načíst dalšíse zobrazí všechny dostupné názvy souborů.