Sdílet prostřednictvím


Migrace z Dataflow Gen1 na Dataflow Gen2

Tento článek se zaměřuje na tvůrce toků dat Power BI. Poskytuje jim pokyny a odůvodnění, které jim pomůžou migrovat toky dat do Dataflow Gen2 v Data Factory pro Microsoft Fabric.

Poznámka

Tok dat Gen2 je nová generace toků dat, která přináší nové funkce a vylepšené prostředí. Toky dat Gen2 se nacházejí vedle toků dat Power BI, které se teď označují jako tok dat Gen1.

Pro pochopení rozdílů mezi Dataflow Gen1 a Dataflow Gen2, viz Přechod z Dataflow generace 1 na generaci 2.

Pozadí

Microsoft Fabric se vyvinul na integrovanou platformu pro podniková data spravovaná samoobslužnou i IT technologií. Díky exponenciálnímu růstu objemu dat a složitosti zákazníci Fabric vyžadují, aby jejich podniková řešení škálovaly, jsou zabezpečená, snadno spravovatelná a přístupná všem uživatelům v největších organizacích.

V posledních letech udělala společnost Microsoft velký pokrok v poskytování škálovatelných cloudových schopností pro kapacitu Fabric. Za tímto účelem služba Data Factory ve Fabric okamžitě umožňuje rozsáhlý ekosystém vývojářů zaměřených na integraci dat a řešení pro datovou integraci vytvořená v průběhu desetiletí. Využívá úplnou sadu funkcí a možností, které jsou daleko nad rámec srovnatelných funkcí dostupných v předchozích generacích.

Zákazníci se teď samozřejmě ptají, jestli existuje příležitost konsolidovat svá řešení integrace dat tím, že je hostují v rámci Fabric. Často se ptají například:

  • Funguje veškerá funkcionalita toku dat, na které závisíme, v Toku dat Gen2?
  • Jaké funkce jsou dostupné jenom v Dataflow Gen2?
  • Jak migrujeme existující toky dat do Dataflow Gen2?
  • Jaký je plán Microsoftu pro příjem podnikových dat?

Odpovědi na mnoho z těchto otázek jsou popsány v tomto článku.

Poznámka

Rozhodnutí o migraci do kapacity Fabric závisí na požadavcích jednotlivých zákazníků. Zákazníci by měli pečlivě vyhodnotit výhody, aby mohli učinit informované rozhodnutí. Očekáváme, že v průběhu času dojde k organickému přechodu na Dataflow Gen2 a naším záměrem je, aby k tomu došlo za podmínek, které jsou pro zákazníka komfortní.

Aby bylo jasno, v současné době neexistují žádné plány na ukončení podpory toků dat Power BI nebo toků dat Power Platform. Je však prioritou zaměřit se na investice do toku dat Gen2 pro příjem podnikových dat, takže hodnota poskytovaná kapacitou Fabric se v průběhu času zvýší. Zákazníci, kteří si vyberou kapacitu Fabric, mohou očekávat, že budou těžit z souladu s plánem produktu Microsoft Fabric.

Konvergence samoobslužné integrace dat a podnikových dat

Konsolidace položek ve Fabric zjednodušuje zjišťování, spolupráci a správu díky společnému umístění prostředků. Umožňuje centrálním IT týmům snadněji přijímat a integrovat oblíbené samoobslužné položky. Zároveň umožňuje zprovoznit klíčové služby přesunu a transformace dat v souladu s firemními standardy, včetně rodokmenu dat a monitorování.

Pro podporu spolupráce a škálovatelných potřeb tvůrců zavádí Dataflow Gen2 v rámci Fabric rychlé kopírování, což umožňuje efektivní nátok velkých objemů dat pomocí infrastruktury backendu Fabric k ukládání a zpracování přechodných dat během transformace. Dokáže bezproblémově zpracovávat terabajty dat. Tvůrci toku dat můžou určit cíle dat pro transformovaná data, jako je Fabric Lakehouse, warehouse, eventhouse nebo Azure SQL Database, což usnadňuje lepší správu a přístupnost dat. A co víc, nedávná integrace generující umělé inteligence prostřednictvím Copilot vylepšuje možnosti přípravy dat tím, že poskytuje inteligentní generování kódu a automatizaci opakovaných úloh a poskytuje jednodušší a rychlejší cestu k vytváření složitých řešení.

Díky využití společné platformy se pracovní postup zefektivňuje, což vede k lepší spolupráci mezi firmou a IT. Organizace jsou proto oprávněny škálovat svá datová řešení na podnikové úrovni, zajistit vysoký výkon, flexibilitu a efektivitu při správě obrovských objemů dat.

Kapacita sítě

Díky distribuované architektuře kapacitě Fabric je méně citlivá na celkové zatížení, dočasné špičky a vysokou souběžnost. Konsolidací kapacit do větších SKU Fabric mohou zákazníci dosáhnout zvýšení výkonu a propustnosti.

Porovnání funkcí

Následující tabulka obsahuje funkce podporované v toku dat Power BI nebo toku dat Fabric Gen2.

Funkce Datový tok Power BI Gen1 Architektura toku dat Gen2
připojení
Podpora všech zdrojů dat Power Query Ano Ano
Připojení a načtení dat z toků dat v Power BI Desktopu, Excelu nebo Power Apps Ano Ano
škálovatelnost
Rychlé kopírování, které podporuje příjem dat ve velkém měřítku, s využitím datového kanálu aktivity kopírování v rámci toků dat Ne Ano
naplánované aktualizace, které udržují data aktuální Ano Ano
Přírůstková aktualizace, který používá zásady k automatizaci přírůstkového načítání dat a může pomoci zajistit generování sestav téměř v reálném čase. Ano Ano
orchestrace datového kanálu, což umožňuje přidat aktivitu toku dat do datového kanálu a vytvářet orchestrované podmíněné události. Ne Ano
Umělá inteligence
Copilot pro službu Data Factory, která poskytuje inteligentní generování kódu pro snadnou transformaci dat a generuje vysvětlení kódu, které pomáhají lépe porozumět složitým úlohám. Ne Ano
cognitive Services, která používá umělou inteligenci (AI) k použití různých algoritmů ze služeb Azure Cognitive Services k obohacení samoobslužné přípravy dat Ano Bez 1
Automatizované strojové učení (AutoML), které obchodním analytikům umožňuje trénovat, ověřovat a volat modely strojového učení (ML) přímo ve Fabric. Zastaralé 2
integraci služby Azure Machine Learning, která zveřejňuje vlastní modely jako dynamické funkce Power Query, které můžou uživatelé vyvolat v Editoru Power Query Ano Bez 1
Správa obsahu
zobrazení rodokmenu dat, které uživatelům pomáhají pochopit a vyhodnotit závislosti položek toku dat Ano Ano
Nasazovací kanály, které spravují životní cyklus obsahu Fabric Ano Ano
škálovatelnost a odolnost platformy
Architektura Premium kapacity, která podporuje zvýšenou škálovatelnost a výkon Ano Ano
podpora Multi-Geo, která pomáhá nadnárodním zákazníkům řešit regionální, oborové nebo organizační požadavky na rezidenci dat Ano 3 Ano
Zabezpečení
Připojení datové brány virtuální sítě (VNet), které umožňuje bezproblémovou činnost Fabric v virtuální síti organizace. Ne Ano
Připojení lokální datové brány, které umožňuje zabezpečený přístup k datům mezi lokálními zdroji dat organizace a službou Fabric. Ano Ano
Podpora značek služeb Azure , což je definovaná skupina IP adres, která se automaticky spravuje s cílem minimalizovat složitost aktualizací nebo změn pravidel zabezpečení sítě. Ano Ano
zásady správy
Doporučení ke schválení, k propagaci nebo certifikaci cenných vysoce kvalitních textilních výrobků Ano Ano
integraci Microsoft Purview, která pomáhá zákazníkům spravovat a řídit položky Fabric Ano Ano
Popisky citlivosti Microsoft Information Protection (MIP) a integrace s Microsoft Defender for Cloud Apps pro prevenci ztráty dat (DLP) Ano Ano
monitorování a diagnostické protokolování
Rozšířená historie aktualizací , která umožňuje podrobně vyhodnotit, co se stalo během aktualizace toku dat. Ne Ano
monitorovací centrum, které poskytuje možnosti monitorování pro prvky Fabric Ne Ano
aplikace Microsoft Fabric Capacity Metrics, která poskytuje možnosti monitorování kapacity Fabricu Ano Ano
Auditní protokol, který sleduje aktivity uživatelů v Fabric a Microsoft 365 Ano Ano

1 Informace o vytváření vlastních funkcí, které volají koncové body rozhraní API Azure AI, najdete v tématu Kurz: Extrakce klíčových frází z textu uloženého v Power BI.

2 Automatizované strojové učení (AutoML) je zastaralé. Další informace najdete v tomto oficiálním oznámení.

3 Aby úložiště toku dat Power BI používalo Azure Data Lake Storage (ADLS) Gen2, podívejte se na tento článek.

Úvahy

Před migrací na Dataflow Gen2 je potřeba vzít v úvahu další aspekty.

Licencování

K publikování nebo správě toků dat Power BI (Dataflow Gen1) potřebujete licenci Pro nebo Premium na uživatele (PPU). Naopak k vytvoření toku dat Gen2 v pracovním prostoru kapacity Premium potřebujete licenci Microsoft Fabric (bezplatnou).

Scénáře migrace

Při migraci toků dat je důležité myslet nad rámec pouhého kopírování existujících řešení. Místo toho doporučujeme modernizovat řešení tím, že využijete nejnovější inovace a možnosti toku dat Gen2. Tento přístup zajišťuje, aby vaše řešení podporovala rostoucí požadavky firmy.

Různé metody upgradu, provádění inventarizace a používání akcelerátorů, jako jsou šablony Power Query, jsou popsány v článku scénáře migrace. Tyto metody vám můžou pomoct zajistit bezproblémový upgrade vašich projektů.

Plán

Plán vydání Microsoft Fabric představuje aktuální aktualizace a časové plány pro budoucí vydání, včetně nových a plánovaných funkcí pro službu Data Factory v Microsoft Fabric.

Další informace o tomto článku najdete v následujících zdrojích informací: