Osvědčené postupy pro opětovné nasazení toků dat napříč prostředími a pracovními prostory
Tento článek popisuje kolekci osvědčených postupů pro efektivní a efektivní použití toků dat. Přečtěte si tento článek, abyste se vyhnuli nástrahám návrhu a potenciálním problémům s výkonem při vývoji toků dat pro opakované použití.
Oddělení toků dat transformace dat od pracovních a extrahovacích toků dat
Pokud tok dat provádí všechny akce, je obtížné opakovaně používat tabulky v jiných tocích dat nebo pro jiné účely. Nejlepšími toky dat, které je potřeba znovu použít, jsou toky dat, které provádějí jen několik akcí. Vytváření toků dat, které se specializují na jeden konkrétní úkol, je jedním z nejlepších způsobů jejich opětovného použití. Pokud máte sadu toků dat, které používáte jako přípravné toky dat, jejich jedinou akcí je extrahovat data z zdrojového systému. Tyto toky dat je možné znovu použít v několika dalších tocích dat.
Pokud máte toky dat transformace dat, můžete je rozdělit na toky dat, které dělají běžné transformace. Každý tok dat může provádět jen několik akcí. Tyto několik akcí na tok dat zajistí, aby výstup tohoto toku dat byl opakovaně použitelný jinými toky dat.
Obrázek s extrahovanými daty ze zdroje dat do pracovních toků dat, kde jsou tabulky uložené buď v Dataverse, nebo v Azure Data Lake Storage. Potom se data přesunou do transformačních toků dat, ve kterých se data transformují a převedou na strukturu datového skladu. Nakonec se data načtou do sémantického modelu Power BI.
Použití více pracovních prostorů
Každý pracovní prostor (nebo prostředí) je k dispozici pouze pro členy tohoto pracovního prostoru. Pokud sestavíte všechny toky dat v jednom pracovním prostoru, minimalizujete opakované použití toků dat. Můžete mít několik obecných pracovních prostorů pro toky dat, které zpracovávají tabulky pro celou společnost. Můžete mít také nějaký pracovní prostor pro toky dat pro zpracování tabulek napříč několika odděleními. A můžete mít také některé pracovní prostory pro toky dat, které se mají používat jenom v konkrétních odděleních.
Nastavení správných úrovní přístupu v pracovních prostorech
Pokud chcete udělit přístup k tokům dat v jiných pracovních prostorech, abyste mohli použít výstup toku dat v pracovním prostoru, stačí jim udělit přístup k zobrazení v pracovním prostoru. Další informace o dalších rolích v pracovním prostoru Power BI najdete v části Role v nových pracovních prostorech.
Doporučení pro tok dat v Power BI
V organizaci tenanta může být vytvořeno mnoho toků dat a uživatelům může být obtížné zjistit, který tok dat je nejspolehlivější. Autoři toku dat nebo uživatelé, kteří k němu mají přístup k úpravám, můžou tok dat doporučit na třech úrovních: bez doporučení, povýšení nebo certifikace.
Tyto úrovně doporučení pomáhají uživatelům snadněji a rychleji najít spolehlivé toky dat. Nejprve se zobrazí tok dat s vyšší úrovní doporučení. Správce Power BI může delegovat možnost doporučit toky dat na certifikovanou úroveň jiným uživatelům. Další informace: Doporučení – Propagace a certifikace obsahu Power BI
Oddělení tabulek v několika tocích dat
V jednom toku dat můžete mít více tabulek. Jedním z důvodů, proč můžete rozdělit tabulky do několika toků dat, je to, co jste se naučili dříve v tomto článku o oddělení příjmu dat a toků dat transformace dat. Dalším dobrým důvodem, proč mít tabulky v několika tocích dat, je, když chcete jiný plán aktualizace než jiné tabulky.
V příkladu zobrazeném na následujícím obrázku musí být tabulka prodejů aktualizována každých čtyři hodiny. Tabulku kalendářních dat je potřeba aktualizovat jenom jednou denně, aby se aktuální záznam kalendářního data aktualizoval. A tabulka mapování produktů se musí aktualizovat jenom jednou týdně. Pokud máte všechny tyto tabulky v jednom toku dat, máte pro všechny jenom jednu možnost aktualizace. Pokud ale tyto tabulky rozdělíte do několika toků dat, můžete naplánovat aktualizaci jednotlivých toků dat samostatně.
Vhodné kandidáty tabulek pro tabulky toku dat
Při vývoji řešení pomocí Power Query v desktopových nástrojích se můžete ptát sami sebe; Které z těchto tabulek jsou vhodnými kandidáty na přesun do toku dat? Nejlepšími tabulkami, které se mají přesunout do toku dat, jsou tabulky, které je potřeba použít ve více než jednom řešení nebo ve více než jednom prostředí nebo službě. Například tabulku kalendářních dat zobrazenou na následujícím obrázku je potřeba použít ve dvou samostatných souborech Power BI. Místo duplikování této tabulky v každém souboru můžete tabulku vytvořit v toku dat jako tabulku a znovu ji použít v těchto souborech Power BI.