Migrace z Dataflow Gen1 na Dataflow Gen2
Tento článek se zaměřuje na tvůrce toků dat Power BI. Poskytuje jim pokyny a odůvodnění, které jim pomůžou migrovat toky dat do Dataflow Gen2 v Data Factory pro Microsoft Fabric.
Poznámka
Tok dat Gen2 je nová generace toků dat, která přináší nové funkce a vylepšené prostředí. Toky dat Gen2 se nacházejí vedle toků dat Power BI, které se teď označují jako tok dat Gen1.
Pro pochopení rozdílů mezi Dataflow Gen1 a Dataflow Gen2, viz Přechod z Dataflow generace 1 na generaci 2.
Pozadí
Microsoft Fabric se vyvinul na integrovanou platformu pro podniková data spravovaná samoobslužnou i IT technologií. Díky exponenciálnímu růstu objemu dat a složitosti zákazníci Fabric vyžadují, aby jejich podniková řešení škálovaly, jsou zabezpečená, snadno spravovatelná a přístupná všem uživatelům v největších organizacích.
V posledních letech udělala společnost Microsoft velký pokrok v poskytování škálovatelných cloudových schopností pro kapacitu Fabric. Za tímto účelem služba Data Factory ve Fabric okamžitě umožňuje rozsáhlý ekosystém vývojářů zaměřených na integraci dat a řešení pro datovou integraci vytvořená v průběhu desetiletí. Využívá úplnou sadu funkcí a možností, které jsou daleko nad rámec srovnatelných funkcí dostupných v předchozích generacích.
Zákazníci se teď samozřejmě ptají, jestli existuje příležitost konsolidovat svá řešení integrace dat tím, že je hostují v rámci Fabric. Často se ptají například:
- Funguje veškerá funkcionalita toku dat, na které závisíme, v Toku dat Gen2?
- Jaké funkce jsou dostupné jenom v Dataflow Gen2?
- Jak migrujeme existující toky dat do Dataflow Gen2?
- Jaký je plán Microsoftu pro příjem podnikových dat?
Odpovědi na mnoho z těchto otázek jsou popsány v tomto článku.
Poznámka
Rozhodnutí o migraci do kapacity Fabric závisí na požadavcích jednotlivých zákazníků. Zákazníci by měli pečlivě vyhodnotit výhody, aby mohli učinit informované rozhodnutí. Očekáváme, že v průběhu času dojde k organickému přechodu na Dataflow Gen2 a naším záměrem je, aby k tomu došlo za podmínek, které jsou pro zákazníka komfortní.
Aby bylo jasno, v současné době neexistují žádné plány na ukončení podpory toků dat Power BI nebo toků dat Power Platform. Je však prioritou zaměřit se na investice do toku dat Gen2 pro příjem podnikových dat, takže hodnota poskytovaná kapacitou Fabric se v průběhu času zvýší. Zákazníci, kteří si vyberou kapacitu Fabric, mohou očekávat, že budou těžit z souladu s plánem produktu Microsoft Fabric.
Konvergence samoobslužné integrace dat a podnikových dat
Konsolidace položek ve Fabric zjednodušuje zjišťování, spolupráci a správu díky společnému umístění prostředků. Umožňuje centrálním IT týmům snadněji přijímat a integrovat oblíbené samoobslužné položky. Zároveň umožňuje zprovoznit klíčové služby přesunu a transformace dat v souladu s firemními standardy, včetně rodokmenu dat a monitorování.
Pro podporu spolupráce a škálovatelných potřeb tvůrců zavádí Dataflow Gen2 v rámci Fabric rychlé kopírování, což umožňuje efektivní nátok velkých objemů dat pomocí infrastruktury backendu Fabric k ukládání a zpracování přechodných dat během transformace. Dokáže bezproblémově zpracovávat terabajty dat. Tvůrci toku dat můžou určit cíle dat pro transformovaná data, jako je Fabric Lakehouse, warehouse, eventhouse nebo Azure SQL Database, což usnadňuje lepší správu a přístupnost dat. A co víc, nedávná integrace generující umělé inteligence prostřednictvím Copilot vylepšuje možnosti přípravy dat tím, že poskytuje inteligentní generování kódu a automatizaci opakovaných úloh a poskytuje jednodušší a rychlejší cestu k vytváření složitých řešení.
Díky využití společné platformy se pracovní postup zefektivňuje, což vede k lepší spolupráci mezi firmou a IT. Organizace jsou proto oprávněny škálovat svá datová řešení na podnikové úrovni, zajistit vysoký výkon, flexibilitu a efektivitu při správě obrovských objemů dat.
Kapacita sítě
Díky distribuované architektuře kapacitě Fabric je méně citlivá na celkové zatížení, dočasné špičky a vysokou souběžnost. Konsolidací kapacit do větších SKU Fabric mohou zákazníci dosáhnout zvýšení výkonu a propustnosti.
Porovnání funkcí
Následující tabulka obsahuje funkce podporované v toku dat Power BI nebo toku dat Fabric Gen2.
Funkce | Datový tok Power BI Gen1 | Architektura toku dat Gen2 |
---|---|---|
připojení | ||
Podpora všech zdrojů dat Power Query | Ano | Ano |
Připojení a načtení dat z toků dat v Power BI Desktopu, Excelu nebo Power Apps | Ano | Ano |
škálovatelnost | ||
Rychlé kopírování, které podporuje příjem dat ve velkém měřítku, s využitím datového kanálu aktivity kopírování v rámci toků dat | Ne | Ano |
naplánované aktualizace, které udržují data aktuální | Ano | Ano |
Přírůstková aktualizace, který používá zásady k automatizaci přírůstkového načítání dat a může pomoci zajistit generování sestav téměř v reálném čase. | Ano | Ano |
orchestrace datového kanálu, což umožňuje přidat aktivitu toku dat do datového kanálu a vytvářet orchestrované podmíněné události. | Ne | Ano |
Umělá inteligence | ||
Copilot pro službu Data Factory, která poskytuje inteligentní generování kódu pro snadnou transformaci dat a generuje vysvětlení kódu, které pomáhají lépe porozumět složitým úlohám. | Ne | Ano |
cognitive Services, která používá umělou inteligenci (AI) k použití různých algoritmů ze služeb Azure Cognitive Services k obohacení samoobslužné přípravy dat | Ano | Bez 1 |
Automatizované strojové učení (AutoML), které obchodním analytikům umožňuje trénovat, ověřovat a volat modely strojového učení (ML) přímo ve Fabric. | Zastaralé 2 | |
integraci služby Azure Machine Learning, která zveřejňuje vlastní modely jako dynamické funkce Power Query, které můžou uživatelé vyvolat v Editoru Power Query | Ano | Bez 1 |
Správa obsahu | ||
zobrazení rodokmenu dat, které uživatelům pomáhají pochopit a vyhodnotit závislosti položek toku dat | Ano | Ano |
Nasazovací kanály, které spravují životní cyklus obsahu Fabric | Ano | Ano |
škálovatelnost a odolnost platformy | ||
Architektura Premium kapacity, která podporuje zvýšenou škálovatelnost a výkon | Ano | Ano |
podpora Multi-Geo, která pomáhá nadnárodním zákazníkům řešit regionální, oborové nebo organizační požadavky na rezidenci dat | Ano 3 | Ano |
Zabezpečení | ||
Připojení datové brány virtuální sítě (VNet), které umožňuje bezproblémovou činnost Fabric v virtuální síti organizace. | Ne | Ano |
Připojení lokální datové brány, které umožňuje zabezpečený přístup k datům mezi lokálními zdroji dat organizace a službou Fabric. | Ano | Ano |
Podpora značek služeb Azure , což je definovaná skupina IP adres, která se automaticky spravuje s cílem minimalizovat složitost aktualizací nebo změn pravidel zabezpečení sítě. | Ano | Ano |
zásady správy | ||
Doporučení ke schválení, k propagaci nebo certifikaci cenných vysoce kvalitních textilních výrobků | Ano | Ano |
integraci Microsoft Purview, která pomáhá zákazníkům spravovat a řídit položky Fabric | Ano | Ano |
Popisky citlivosti Microsoft Information Protection (MIP) a integrace s Microsoft Defender for Cloud Apps pro prevenci ztráty dat (DLP) | Ano | Ano |
monitorování a diagnostické protokolování | ||
Rozšířená historie aktualizací , která umožňuje podrobně vyhodnotit, co se stalo během aktualizace toku dat. | Ne | Ano |
monitorovací centrum, které poskytuje možnosti monitorování pro prvky Fabric | Ne | Ano |
aplikace Microsoft Fabric Capacity Metrics, která poskytuje možnosti monitorování kapacity Fabricu | Ano | Ano |
Auditní protokol, který sleduje aktivity uživatelů v Fabric a Microsoft 365 | Ano | Ano |
1 Informace o vytváření vlastních funkcí, které volají koncové body rozhraní API Azure AI, najdete v tématu Kurz: Extrakce klíčových frází z textu uloženého v Power BI.
2 Automatizované strojové učení (AutoML) je zastaralé. Další informace najdete v tomto oficiálním oznámení.
3 Aby úložiště toku dat Power BI používalo Azure Data Lake Storage (ADLS) Gen2, podívejte se na tento článek.
Úvahy
Před migrací na Dataflow Gen2 je potřeba vzít v úvahu další aspekty.
Licencování
K publikování nebo správě toků dat Power BI (Dataflow Gen1) potřebujete licenci Pro nebo Premium na uživatele (PPU). Naopak k vytvoření toku dat Gen2 v pracovním prostoru kapacity Premium potřebujete licenci Microsoft Fabric (bezplatnou).
Scénáře migrace
Při migraci toků dat je důležité myslet nad rámec pouhého kopírování existujících řešení. Místo toho doporučujeme modernizovat řešení tím, že využijete nejnovější inovace a možnosti toku dat Gen2. Tento přístup zajišťuje, aby vaše řešení podporovala rostoucí požadavky firmy.
Různé metody upgradu, provádění inventarizace a používání akcelerátorů, jako jsou šablony Power Query, jsou popsány v článku scénáře migrace. Tyto metody vám můžou pomoct zajistit bezproblémový upgrade vašich projektů.
Plán
Plán vydání Microsoft Fabric představuje aktuální aktualizace a časové plány pro budoucí vydání, včetně nových a plánovaných funkcí pro službu Data Factory v Microsoft Fabric.
Související obsah
Další informace o tomto článku najdete v následujících zdrojích informací:
- scénáře migrace toku dat
- Co je Data Factory v Microsoft Fabric?
- Přechod z toku dat 1. generace na tok dat 2. generace
- Otázky? Zkuste se zeptat komunity Fabric
- Návrhy? Přispějte nápady k vylepšení Fabric