Sdílet prostřednictvím


Kombinování souborů CSV

V Power Query můžete zkombinovat více souborů z daného zdroje dat. Tento článek popisuje, jak funguje prostředí, když soubory, které chcete zkombinovat, jsou soubory CSV. Další informace: Kombinování souborů přehled

Spropitné

Můžete postupovat podle tohoto příkladu stažením ukázkových souborů použitých v tomto článku z tohoto odkazu ke stažení. Tyto soubory můžete umístit do zvoleného zdroje dat, jako je místní složka, složka SharePointu, úložiště objektů blob Azure, Azure Data Lake Storage nebo jiný zdroj dat, který poskytuje zobrazení systému souborů.

Pro zjednodušení používá příklad v tomto článku konektor složky. Další informace: složky

Informace o použitých ukázkových souborech

Ke kombinování souborů je nezbytné, aby všechny měly stejnou strukturu a stejnou příponu. Všechny soubory použité v tomto příkladu mají stejnou strukturu a příponu (.csv).

Existuje 12 souborů CSV, jeden pro každý měsíc kalendářního roku 2019. Následující obrázek ukazuje prvních 15 řádků souboru za měsíc leden.

snímek obrazovky s ukázkovým souborem CSV pro leden 2019 zobrazující oddíl záhlaví a zbytek dat oddělený čárkami

Počet řádků se liší od souboru po soubor, ale všechny soubory mají v prvních čtyřech řádcích oddíl záhlaví. V pátém řádku mají záhlaví sloupců a data tabulky začínají v šestém řádku a procházejí všemi následujícími řádky.

Cílem je zkombinovat všechny 12 souborů do jedné tabulky. Tato kombinovaná tabulka obsahuje řádek záhlaví v horní části tabulky a obsahuje zdrojový název, datum, zemi, jednotky a údaje o výnosech za celý rok v samostatných sloupcích za řádkem záhlaví.

Snímek obrazovky ukázkové konečné kombinované tabulky

Náhled tabulky

Při připojování ke složce, která je hostitelem souborů, které chcete zkombinovat – v tomto příkladu je název této složky soubory CSV– zobrazí se dialogové okno náhledu tabulky, ve kterém se zobrazí cesta ke složce v levém horním rohu. Náhled dat zobrazuje zobrazení systému souborů.

Snímek obrazovky s náhledem tabulky pro zobrazení systému souborů

V tomto příkladu vyberte Kombinovat. V Excelu nebo Power Query Desktopu vyberte Kombinovat & Transformace dat.

Poznámka

V jiné situaci byste mohli vybrat Transformovat data, abyste svá data dále filtrovali a transformovali před kombinováním souborů. Výběr možnosti Kombinovat se doporučuje jenom v případech, kdy jste si jistí, že složka obsahuje jenom soubory, které chcete zkombinovat.

Dialogové okno Kombinovat soubory

Po výběru Zkombinovat v náhledu tabulky se zobrazí dialogové okno Kombinovat soubory.

snímek obrazovky dialogu Kombinovat soubory se zobrazenými daty souborů

Poznámka

Power Query automaticky zjistí, jaký konektor se má použít, na základě prvního souboru nalezeného v seznamu. Další informace o konektoru CSV najdete v části Text/CSV.

V tomto příkladu ponechte všechna výchozí nastavení (Příklad souboru nastaven na První soubora výchozí hodnoty pro původ souboru, oddělovača detekce datových typů).

Nyní vyberte Transformovat data v pravém dolním rohu a přejděte na výstupní dotaz.

Výstupní dotaz

Po výběru Transformovat data v dialogovém okně Kombinovat soubory se vrátíte do Editoru Power Query v dotazu, který jste původně vytvořili z připojení k místní složce. Výstupní dotaz teď obsahuje název zdrojového souboru v levém sloupci spolu s daty ze všech zdrojových souborů ve zbývajících sloupcích.

snímek obrazovky s výstupním dotazem pro kombinované soubory bez dalších transformací

Data ale nejsou ve správném tvaru. Před kombinováním těchto řádků je potřeba z každého souboru odebrat horní čtyři řádky. Chcete-li tuto změnu provést v každém souboru, než je zkombinujete, vyberte dotaz transformovat ukázkový soubor v podokně Dotazy na levé straně obrazovky.

Upravte dotaz souboru s ukázkou transformace

V tomto dotazu v ukázkovém souboru transformace hodnoty ve sloupci Date ukazují, že data jsou z dubna, který má formát rok-měsíc-den (RRRR-MM-DD). Duben 2019.csv je první soubor zobrazený v náhledu tabulky.

snímek obrazovky ukázkového souboru transformace se sloupci dat z dubna 2019 a sekcí záhlaví

Teď potřebujete k vyčištění dat použít novou sadu transformací. Každá transformace se automaticky převede na funkci uvnitř skupiny pomocných dotazů a, která se použije u každého souboru ve složce před kombinací dat z každého souboru.

Transformace, které je potřeba přidat do ukázkového souboru transformací v dotazu, jsou:

  1. Odebrat horní řádky: Chcete-li tuto operaci provést, vyberte nabídku ikony tabulky v levém horním rohu tabulky a pak vyberte Odebrat horní řádky.

    Snímek obrazovky s nabídkou ikon tabulky, se zvýrazněnou možností

    V dialogovém okně Odebrat horní řádky zadejte 4a pak vyberte OK.

    Snímek obrazovky s dialogovým oknem Odebrat horní řádky se čtyřmi řádky, které se mají odebrat

    Jakmile vyberete OK, tabulka už nemá horní čtyři řádky.

    Snímek obrazovky ukázkového dotazu po odstranění horních čtyř řádků

  2. Použít první řádek jako záhlaví: Znovu vyberte ikonu tabulky a pak vyberte Použít první řádek jako záhlaví.

    Snímek obrazovky nabídky ikon tabulky, kde je zvýrazněna možnost Použít první řádek jako záhlaví.

    Výsledek této operace propaguje první řádek tabulky na záhlaví nových sloupců.

    snímek obrazovky ukázkové tabulky se záhlavími se zvýšenou úrovní

Po dokončení této operace se Power Query ve výchozím nastavení pokusí automaticky rozpoznat datové typy sloupců a přidat nový krok Změna typu sloupce.

Revize výstupního dotazu

Když se vrátíte k dotazu souborů CSV v Power Query Desktopu, posledním krokem je chyba, která vypisuje 'sloupec „Column1“ v tabulce nebyl nalezen'. Když se vrátíte k dotazu souborů CSV z Power Query Online, změny, které jste předtím provedli pro odebrání prvních čtyř řádků a použití prvního řádku jako záhlaví, nebyly aplikovány na tabulku. V Power Query Online vyberte Aktualizovat na kartě Domů. Jakmile se obrazovka aktualizuje, zobrazí se stejná chybová zpráva.

Důvodem této chyby je, že předchozí stav dotazu prováděl operaci se sloupcem s názvem Column1. Vzhledem k změnám v ukázkovém souboru transformace dotazu už tento sloupec neexistuje. Další informace: Řešení chyb v Power Query

snímek obrazovky výstupního dotazu s chybou na úrovni kroku

Tento poslední krok dotazu můžete odebrat z podokna Použitý postup výběrem ikony odstranění X na levé straně názvu kroku. Po odstranění tohoto kroku zobrazí dotaz správné výsledky.

Snímek obrazovky se sloučenými soubory bez kroku s chybou

Všimněte si však, že žádný ze sloupců odvozených ze souborů (Date, Country, Units, Revenue) nemá přiřazený konkrétní datový typ. Pomocí následující tabulky přiřaďte ke každému sloupci správný datový typ.

Název sloupce Datový typ
Datum Datum
Země Text
Jednotky Celé číslo
Výnos Měna

Po definování datových typů pro každý sloupec jste připraveni načíst tabulku.

Snímek obrazovky konečné kombinované tabulky s ukázkou

Poznámka

Pokud chcete zjistit, jak definovat nebo změnit datové typy sloupců, přejděte na Datové typy.

Ověření

Pokud chcete ověřit, že jsou všechny soubory sloučené, můžete v záhlaví sloupce Source.Name vybrat ikonu filtru, která zobrazí všechny názvy sloučených souborů. Pokud se zobrazí upozornění "Seznam může být neúplný", vyberte v dolní části nabídky možnost Načíst další, aby se ve sloupci zobrazily další dostupné hodnoty.

Snímek obrazovky s dialogovým oknem filtru s neúplným seznamem sloučených souborů

Po kliknutí na Načíst dalšíse zobrazí všechny dostupné názvy souborů.

Snímek obrazovky s dialogovým oknem filtru s úplným seznamem sloučených souborů