Sdílet prostřednictvím


Vývoj řešení s toky dat

Toky dat Power BI jsou podnikové řešení pro přípravu dat, které umožňuje ekosystém dat připravených ke spotřebě, opětovnému použití a integraci. Tento článek obsahuje některé běžné scénáře, odkazy na články a další informace, které vám pomůžou pochopit a používat toky dat k jejich plnému potenciálu.

Získání přístupu k prémiovým funkcím toků dat

Toky dat Power BI v kapacitách Premium poskytují mnoho klíčových funkcí, které pomáhají dosáhnout většího škálování a výkonu toků dat, například:

  • Pokročilé výpočetní prostředky, které urychlují výkon ETL a poskytují možnosti DirectQuery.
  • Přírůstková aktualizace, která umožňuje načíst data, která se změnila ze zdroje.
  • Propojené entity, které můžete použít k odkazování na jiné toky dat.
  • Počítané entity, které můžete použít k vytváření kompozibilních stavebních bloků toků dat, které obsahují více obchodní logiky.

Z těchto důvodů doporučujeme používat toky dat v kapacitě Premium, kdykoli je to možné. Toky dat používané v licenci Power BI Pro je možné použít pro jednoduché malé případy použití.

Řešení

Získání přístupu k těmto prémiovým funkcím toků dat je možné dvěma způsoby:

  • Určete kapacitu Premium pro daný pracovní prostor a sem přineste vlastní licenci Pro pro vytváření toků dat.
  • Přineste si vlastní licenci na Premium na uživatele (PPU), která vyžaduje, aby ostatní členové pracovního prostoru měli také licenci PPU.

Toky dat PPU (ani žádný jiný obsah) nemůžete využívat mimo prostředí PPU (například v premium nebo jiných cenových úrovních nebo licencích).

U kapacit Premium uživatelé toků dat v Power BI Desktopu nepotřebují explicitní licence k využívání a publikování do Power BI. Pokud ale chcete publikovat do pracovního prostoru nebo sdílet výsledný sémantický model, potřebujete alespoň licenci Pro.

Pro PPU musí mít každý, kdo vytváří nebo spotřebovává obsah PPU, licenci PPU. Tento požadavek se liší od zbytku Power BI v tom, že potřebujete explicitně licencovat všechny uživatele s PPU. Pokud nemigrujete pracovní prostor do kapacity Premium, nemůžete kombinovat kapacity Free, Pro ani premium s obsahem PPU.

Výběr modelu obvykle závisí na velikosti a cílech vaší organizace, ale platí následující pokyny.

Typ týmu Premium na kapacitu Premium na uživatele
>5 000 uživatelů
<5 000 uživatelů

U malých týmů může PPU překlenout mezeru mezi free, Pro a Premium na kapacitu. Pokud máte větší potřeby, je nejlepší použít kapacitu Premium s uživateli, kteří mají licence Pro.

Vytvoření toků dat uživatelů s použitým zabezpečením

Představte si, že potřebujete vytvořit toky dat pro spotřebu, ale mít požadavky na zabezpečení:

Diagram, který popisuje scénář

V tomto scénáři pravděpodobně máte dva typy pracovních prostorů:

  • Back-endové pracovní prostory, ve kterých vyvíjíte toky dat a vytváříte obchodní logiku.

  • Uživatelské pracovní prostory, ve kterých chcete zpřístupnit některé toky dat nebo tabulky konkrétní skupině uživatelů pro použití:

    • Pracovní prostor uživatele obsahuje propojené tabulky, které odkazují na toky dat v back-endovém pracovním prostoru.
    • Uživatelé mají přístup k pracovnímu prostoru příjemce a nemají přístup k back-endovém pracovnímu prostoru.
    • Když uživatel používá Power BI Desktop pro přístup k toku dat v pracovním prostoru uživatele, uvidí tok dat. Protože se ale tok dat v Navigátoru zobrazuje prázdný, propojené tabulky se nezobrazují.

Principy propojených tabulek

Propojené tabulky jsou jednoduše ukazatelem na původní tabulky toku dat a dědí oprávnění zdroje. Pokud Power BI povolil, aby propojená tabulka používala cílové oprávnění, může každý uživatel obejít oprávnění ke zdroji vytvořením propojené tabulky v cíli, která odkazuje na zdroj.

Řešení: Použití počítaných tabulek

Pokud máte přístup k Power BI Premium, můžete v cíli vytvořit počítanou tabulku, která odkazuje na propojenou tabulku, která obsahuje kopii dat z propojené tabulky. Sloupce můžete odebrat projekcí a odebrat řádky prostřednictvím filtrů. Uživatel s oprávněním k cílovému pracovnímu prostoru má přístup k datům prostřednictvím této tabulky.

Rodokmen pro privilegované jednotlivce také zobrazuje odkazovaný pracovní prostor a umožňuje uživatelům odkazovat zpět, aby plně porozuměli nadřazeným tokům dat. Pro uživatele, kteří nejsou privilegovaní, se stále respektuje ochrana osobních údajů. Zobrazí se jenom název pracovního prostoru.

Toto nastavení znázorňuje následující diagram. Na levé straně je architektonické schéma. Vpravo je příklad znázorňující rozdělení a zabezpečení prodejních dat podle oblasti.

Diagram, který popisuje, jak používat propojené tabulky a toky dat

Zkrácení doby aktualizace toků dat

Představte si, že máte velký tok dat, ale chcete vytvořit sémantické modely z tohoto toku dat a zkrátit dobu potřebnou k jeho aktualizaci. Dokončení aktualizací ze zdroje dat do toků dat do sémantického modelu obvykle trvá dlouho. Zdlouhavé aktualizace se obtížně spravují nebo udržují.

Řešení: Použití tabulek s explicitně nakonfigurovaným povolením načtení pro odkazované tabulky a nezakazujte načítání.

Power BI podporuje jednoduchou orchestraci toků dat, jak je definováno při pochopení a optimalizaci aktualizace toků dat. Pokud využíváte orchestraci, musíte mít explicitně nakonfigurované všechny podřízené toky dat tak, aby povolovaly načtení.

Zakázání zatížení je obvykle vhodné jenom v případě, že režie při načítání dalších dotazů zruší výhodu entity, se kterou vyvíjíte.

Když zakážete načtení, znamená to, že Power BI daný dotaz nevyhodnocuje, pokud se používá jako složky, to znamená, že se na něj odkazuje v jiných tocích dat, znamená to také, že Power BI s ním nezachází jako s existující tabulkou, kde můžeme poskytnout ukazatel na posouvání a provádět optimalizace dotazů. V tomto smyslu je provádění transformací, jako je spojení nebo sloučení, pouze spojení nebo sloučení dvou dotazů na zdroj dat. Tyto operace můžou mít negativní vliv na výkon, protože Power BI musí znovu znovu načíst vypočítanou logiku a pak použít další logiku.

Pokud chcete zjednodušit zpracování dotazů toku dat a zajistit, aby probíhaly všechny optimalizace modulu, povolte načtení a ujistěte se, že je výpočetní modul v tocích dat Power BI Premium nastavený na výchozí nastavení, které je optimalizováno.

Povolení načtení také umožňuje zachovat úplné zobrazení rodokmenu, protože Power BI považuje za novou položku tok dat, který není povolený. Pokud je pro vás rodokmen důležitý, nezakažte načítání entit nebo toků dat připojených k jiným tokům dat.

Zkrácení doby aktualizace pro sémantické modely

Představte si, že máte tok dat, který je velký, ale chcete z něj vytvářet sémantické modely a snížit orchestraci. Dokončení aktualizací ze zdroje dat do toků dat do sémantických modelů trvá dlouho, což zvyšuje latenci.

Řešení: Použití toků dat DirectQuery

DirectQuery je možné použít vždy, když je nastavení rozšířeného výpočetního modulu (ECE) pracovního prostoru nakonfigurované explicitně na Zapnuto. Toto nastavení je užitečné, když máte data, která není potřeba načíst přímo do modelu Power BI. Pokud službu ECE konfigurujete tak, aby byla poprvé zapnutá , dojde k změnám, které umožňují DirectQuery, během další aktualizace. Když ho povolíte, aby se změny projevily okamžitě, musíte ho aktualizovat. Aktualizace počátečního načtení toku dat můžou být pomalejší, protože Power BI zapisuje data do úložiště i do spravovaného modulu SQL.

Shrnutí s využitím DirectQuery s toky dat umožňuje následující vylepšení procesů Power BI a toků dat:

  • Vyhněte se samostatným plánům aktualizace: DirectQuery se připojuje přímo k toku dat, což eliminuje potřebu vytvoření importovaného sémantického modelu. Použití DirectQuery s toky dat znamená, že už nepotřebujete samostatné plány aktualizací pro tok dat a sémantický model, abyste zajistili synchronizaci dat.
  • Filtrování dat: DirectQuery je užitečné pro práci s filtrovaným zobrazením dat uvnitř toku dat. Pokud chcete filtrovat data a tímto způsobem pracovat s menší podmnožinou dat v toku dat, můžete pomocí DirectQuery (a ECE) filtrovat data toku dat a pracovat s vyfiltrovanou podmnožinou, kterou potřebujete.

Obecně platí, že použití DirectQuery vymění aktuální data v sémantickém modelu s pomalejším výkonem sestavy v porovnání s režimem importu. Tento přístup zvažte pouze v těchto případech:

  • Váš případ použití vyžaduje data s nízkou latencí přicházející z vašeho toku dat.
  • Data toku dat jsou velká.
  • Import by byl příliš časově náročný.
  • Jste ochotni obchodovat s výkonem uloženým v mezipaměti za aktuální data.

Řešení: Použití konektoru toků dat k povolení posouvání dotazů a přírůstkové aktualizace pro import

Sjednocený konektor toků dat může výrazně zkrátit dobu vyhodnocení kroků provedených u počítaných entit, jako je provádění spojení, jedinečných, filtrů a seskupení podle operací. Existují dvě konkrétní výhody:

  • Podřízení uživatelé, kteří se připojují ke konektoru toků dat v Power BI Desktopu, můžou využít lepšího výkonu ve scénářích vytváření, protože nový konektor podporuje posouvání dotazů.
  • Sémantické operace aktualizace modelu se také můžou skládat do vylepšeného výpočetního modulu, což znamená, že i přírůstková aktualizace z sémantického modelu se může skládat do toku dat. Tato funkce zlepšuje výkon aktualizace a potenciálně snižuje latenci mezi cykly aktualizace.

Pokud chcete tuto funkci povolit pro jakýkoli tok dat Premium, ujistěte se, že je výpočetní modul explicitně nastavený na Zapnuto. Pak použijte konektor Toky dat v Power BI Desktopu. Abyste mohli tuto funkci využít, musíte použít verzi Power BI Desktopu ze srpna 2021 nebo novější.

Pokud chcete tuto funkci použít pro stávající řešení, musíte být v předplatném Premium nebo Premium na uživatele. Je také možné, že budete muset provést určité změny toku dat, jak je popsáno v části Použití vylepšeného výpočetního modulu. Je nutné aktualizovat všechny existující dotazy Power Query tak, aby používaly nový konektor nahrazením PowerBI.Dataflows v oddílu PowerPlatform.DataflowsZdroj .

Vytváření složitých toků dat v Power Query

Představte si, že máte tok dat, který je miliony řádků dat, ale chcete s ním vytvářet složitou obchodní logiku a transformace. Chcete dodržovat osvědčené postupy pro práci s velkými toky dat. K rychlému provedení potřebujete také náhledy toku dat. Máte ale desítky sloupců a milionů řádků dat.

Řešení: Použití zobrazení schématu

Můžete použít zobrazení schématu, které je navržené tak, aby optimalizovalo tok při práci na operacích na úrovni schématu tak, že umístíte informace o sloupci dotazu do popředí a na střed. Zobrazení schématu poskytuje kontextové interakce pro tvarování datové struktury. Zobrazení schématu také poskytuje operace s nižší latencí, protože vyžaduje, aby se počítaly pouze metadata sloupců, a ne kompletní výsledky dat.

Práce s většími zdroji dat

Představte si, že spustíte dotaz ve zdrojovém systému, ale nechcete poskytnout přímý přístup k systému nebo demokratizaci přístupu. Plánujete ho umístit do toku dat.

Řešení 1: Použití zobrazení pro dotaz nebo optimalizace dotazu

Nejlepší možností je použití optimalizovaného zdroje dat a dotazu. Zdroj dat často funguje nejlépe s dotazy, které jsou pro něj určeny. Power Query nabízí pokročilé možnosti posouvání dotazů k delegování těchto úloh. Power BI také poskytuje indikátory posouvání kroků v Power Query Online. Další informace o typech indikátorů najdete v dokumentaci k ukazatelům skládání kroků.

Řešení 2: Použití nativního dotazu

Můžete také použít funkci Value.NativeQuery() M. Ve třetím parametru nastavíte EnableFolding=true . Nativní dotaz je zdokumentovaný na tomto webu konektoru Postgres. Funguje také pro konektor SQL Serveru.

Řešení 3: Rozdělení toku dat do toků dat příjmu a spotřeby za účelem využití výhod ECE a propojených entit

Rozdělením toku dat do samostatných toků dat příjmu a spotřeby můžete využít výhod ECE a propojených entit. Další informace o tomto vzoru a dalších najdete v dokumentaci k osvědčeným postupům.

Zajištění, aby zákazníci používali toky dat, kdykoli je to možné

Představte si, že máte mnoho toků dat, které slouží běžným účelům, jako jsou například zákazníci, tabulky dat, produkty a zeměpisné oblasti. Toky dat jsou už dostupné na pásu karet pro Power BI. V ideálním případě chcete, aby zákazníci primárně používali toky dat, které jste vytvořili.

Řešení: Použití doporučení k certifikaci a propagaci toků dat

Další informace o tom, jak doporučení funguje, najdete v tématu Doporučení: Podpora a certifikace obsahu Power BI.

Programovatelnost a automatizace v tocích dat Power BI

Představte si, že máte obchodní požadavky na automatizaci importů, exportů nebo aktualizací a další orchestrace a akcí mimo Power BI. Můžete to povolit několika způsoby, jak je popsáno v následující tabulce.

Typ Mechanismus
Použijte šablony PowerAutomate. Bez kódu
Použijte automatizační skripty v PowerShellu. Skripty pro Automation
Vytvořte vlastní obchodní logiku pomocí rozhraní API. REST API

Další informace o aktualizaci najdete v tématu Principy a optimalizace aktualizace toků dat.

Ujistěte se, že chráníte datové prostředky podřízené.

Pomocí popisků citlivosti můžete použít klasifikaci dat a všechna pravidla nakonfigurovaná pro podřízené položky, které se připojují k vašim tokům dat. Další informace o popiscích citlivosti najdete v tématu Popisky citlivosti v Power BI. Pokud chcete zkontrolovat dědičnost, přečtěte si téma Dědičnost popisku citlivosti v Power BI.

Podpora multi-geo

Mnoho zákazníků dnes potřebuje splnit požadavky na suverenitu dat a rezidenci. Ruční konfiguraci pracovního prostoru toků dat můžete dokončit tak, aby byl multi-geo.

Toky dat podporují multi-geo, když používají funkci přineste si vlastní účet úložiště. Tato funkce je popsaná v konfiguraci úložiště toku dat pro použití Azure Data Lake Gen2. Před připojením této funkce musí být pracovní prostor prázdný. S touto konkrétní konfigurací můžete data toku dat ukládat do konkrétních geografických oblastí podle vašeho výběru.

Ujistěte se, že chráníte datové prostředky za virtuální sítí.

Mnoho zákazníků dnes potřebuje zabezpečit datové prostředky za privátním koncovým bodem. K tomu použijte virtuální sítě a bránu, abyste zůstali v souladu s předpisy. Následující tabulka popisuje aktuální podporu virtuální sítě a vysvětluje, jak používat toky dat k zajištění dodržování předpisů a ochrany datových prostředků.

Scénář Stav
Čtení zdrojů dat virtuální sítě prostřednictvím místní brány Podporováno prostřednictvím místní brány
Pomocí místní brány můžete zapisovat data do účtu popisku citlivosti za virtuální sítí. Zatím není podporováno.

Následující články obsahují další informace o tocích dat a Power BI: