Popis čištění a transformace dat v Power BI Desktop
Při práci s daty z různých zdrojů dat nemusí být vždy ve formátu, který umožňuje jejich zobrazení s jinými daty. Můžete se například připravit na vytvoření sestavy využití zařízení, která zobrazí podrobnosti o zařízeních souvisejících s IoT pro jednotlivé zákazníky. Tato data obvykle existují ve více systémech. Podrobnosti o zákazníkovi jsou pravděpodobně v systému CRM (Customer Relationship Management) vaší organizace, zatímco data IoT jsou pravděpodobně uložená ve vyhrazeném systému IoT, jako je Azure IoT Hub. Data IoT často nejsou strukturovaná tak pěkně jako data ve vašem systému CRM. Některá data nemusí být ve správném formátu nebo jich může být víc, než potřebujete. V těchto případech potřebujete data vyčistit a transformovat. Čištění a transformace dat je způsob, jak připravit data a připravit je k použití. K zahájení transformace a čištění dat použijete aplikaci Power BI Desktop.
Power BI Desktop zahrnuje tři zobrazení:
Zobrazení sestavy: Můžete vytvářet dotazy a vytvářet působivé vizualizace, které můžete sdílet s ostatními. Můžete je uspořádat tak, jak chcete, aby se zobrazovaly.
Zobrazení dat: Prohlédněte si data v sestavě ve formátu datového modelu, kde můžete přidávat míry, vytvářet nové sloupce a spravovat relace.
Zobrazení modelu: Získejte grafické znázornění relací vytvořených v datovém modelu a spravujte je nebo upravte podle potřeby.
Součástí Power BI Desktopu je nástroj Editor Power Query, ve kterém můžete data formátovat a transformovat, aby byla připravená pro modely a vizualizace.
Začněte tím, že v okně Navigátor vyberete Upravit a spustíte Editor Power Query. Editor Power Query můžete také spustit přímo z Power BI Desktop pomocí tlačítka Transformovat data na pásu karet Domů.
Transformace dat
Jak už jsme zmínili, transformace dat je proces vložení dat do formátu, který se dá použít v sestavách. Mezi ně patří odebrání sloupce z tabulky, duplikování sloupce pod novým názvem nebo nahrazení hodnot.
Vyčištění dat
I když Power BI dokáže naimportovat data prakticky z jakéhokoli zdroje, jeho nástroje pro vizualizaci a modelování fungují nejlépe se sloupcovými daty. Někdy nejsou data naformátovaná v jednoduchých sloupcích, což je často případ excelových tabulek.
Rozložení tabulky, které vyhovuje uživateli, nemusí být vhodné pro automatizované dotazy. Uveďme si například následující tabulku, jejíž záhlaví přesahují do více sloupců.
Když data čistíte, můžete tyto řádky zkombinovat do jedné položky, abyste data lépe naformátováli podle svých potřeb. Nebo můžete mít řadu číselných dat, která je potřeba agregovat, aby se lépe zobrazila. S Power Query existuje řada nástrojů, které můžete použít k přípravě dat.
Účelem tohoto modulu bylo seznámit vás se základními koncepty čištění a transformace dat. Další informace o transformaci, tvarování a modelování dat v Power BI najdete tady: Transformace, tvarování a modelování dat v Power BI.