Rychlý start: Přesun a transformace dat pomocí toků dat a datových kanálů
V tomto kurzu zjistíte, jak může tok dat a prostředí datového kanálu vytvořit výkonné a komplexní řešení Data Factory.
Požadavky
Abyste mohli začít, musíte mít následující požadavky:
- Účet tenanta s aktivním předplatným. Vytvořte bezplatný účet.
- Ujistěte se, že máte povolený pracovní prostor Microsoft Fabric: Vytvořit pracovní prostor, který není výchozím pracovním prostorem.
- databáze Azure SQL s tabulkovými daty.
- účet služby Blob Storage.
Toky dat ve srovnání s potrubími
Datové toky Gen2 vám umožňují používat rozhraní s nízkým kódem a více než 300 transformací založených na datech a umělé inteligenci, abyste mohli snadno čistit, připravovat a transformovat data s větší flexibilitou než jakýkoli jiný nástroj. Datové kanály umožňují bohaté předem připravené možnosti orchestrace dat, které vám umožní sestavovat flexibilní datové pracovní postupy, jež vyhovují potřebám vašeho podniku. V pipeline můžete vytvořit logické seskupení aktivit, které provádějí úlohu, což může zahrnovat volání služby Dataflow k vyčištění a přípravě vašich dat. I když se některé funkce mezi těmito dvěma funkcemi překrývají, výběr, který se má použít pro konkrétní scénář, závisí na tom, jestli požadujete plnou bohatost kanálů, nebo můžete použít jednodušší, ale omezenější možnosti toků dat. Další informace najdete v příručce pro rozhodování o Fabric
Transformace dat pomocí toků dat
Postupujte podle těchto kroků a nastavte tok dat.
Krok 1: Vytvoření toku dat
Zvolte pracovní prostor s podporou Fabric, a pak vyberte Nový. Pak vyberte Dataflow Gen2.
Zobrazí se okno editoru toku dat. Vyberte kartu Importovat ze SQL Serveru.
Krok 2: Získání dat
V dialogovém okně Připojit ke zdroji dat níže zadejte podrobnosti pro připojení k databázi Azure SQL a pak vyberte Další. V tomto příkladu použijete ukázkovou databázi AdventureWorksLT nakonfigurovanou při nastavování databáze Azure SQL v rámci předpokladů.
Vyberte data, která chcete transformovat, a pak vyberte Vytvořit. Pro tento rychlý start vyberte SalesLT.Customer z ukázkových dat AdventureWorksLT poskytnutých pro Azure SQL DB a poté vyberte tlačítko Vybrat související tabulky pro automatické zahrnutí dvou dalších souvisejících tabulek.
Krok 3: Transformace dat
Pokud není vybrán, zvolte tlačítko Zobrazení diagramu na stavovém řádku ve spodní části stránky nebo zvolte Zobrazení diagramu v nabídce Zobrazení v horní části editoru Power Query. Některé z těchto možností můžou přepnout zobrazení diagramu.
Klikněte pravým tlačítkem na dotaz SalesLT Customer, nebo vyberte svislou elipsu napravo od dotazu, a poté vyberte Sloučit dotazy.
Sloučení nakonfigurujte tak, že vyberete tabulku SalesLTOrderHeader jako správnou tabulku pro sloučení, sloupec CustomerID z každé tabulky jako sloupec spojení a levý vnější jako druh spojení. Potom výběrem OK přidejte slučovací dotaz.
Vyberte tlačítko Přidat cíl dat, které vypadá jako symbol databáze se šipkou nad ním, z nového sloučeného dotazu, který jste vytvořili. Pak jako cílový typ vyberte databáze Azure SQL.
Zadejte podrobnosti o připojení k databázi Azure SQL, kde se má publikovat slučovací dotaz. V tomto příkladu můžete použít také databázi AdventureWorksLT, kterou jsme použili jako zdroj dat pro cíl.
Zvolte databázi, do které chcete uložit data, a zadejte název tabulky a pak vyberte Další.
Výchozí nastavení můžete ponechat v dialogovém okně Zvolte nastavení cíle a stačí vybrat Uložit nastavení beze změn.
Pokud chcete tok dat publikovat, vyberte Publikovat zpět na stránce editoru toku dat.
Přesun dat pomocí datových kanálů
Nyní, když jste vytvořili Dataflow Gen2, můžete s ním pracovat v datovém kanálu. V tomto příkladu zkopírujete data vygenerovaná z toku dat do textového formátu v účtu služby Azure Blob Storage.
Krok 1: Vytvoření nového datového kanálu
V pracovním prostoru vyberte Novýa pak vyberte datový kanál.
Pojmenujte kanál a pak vyberte Vytvořit.
Krok 2: Konfigurace toku dat
Přidejte do datového kanálu novou aktivitu toku dat výběrem na kartě Aktivity.
Vyberte tok dat na plátně potrubí a pak kartu Nastavení. V rozevíracím seznamu vyberte tok dat, který jste vytvořili dříve.
Vyberte Uložita potom Spustit, aby se tok dat spustil, aby se na začátku naplnila sloučená tabulka dotazů, kterou jste navrhli v předchozím kroku.
Krok 3: Přidání aktivity kopírování pomocí pomocníka pro kopírování
Vyberte Kopírovat data na plátně a otevřete nástroj Copy Assistant, abyste mohli začít. Nebo vyberte Použít pomocníka pro kopírování z rozevíracího seznamu Kopírování dat pod kartou Aktivity na pásu karet.
Vyberte zdroj dat tak, že vyberete typ zdroje dat. V tomto kurzu použijete Službu Azure SQL Database použitou dříve při vytváření toku dat k vygenerování nového slučovacího dotazu. Posuňte se dolů pod ukázkové nabídky dat a vyberte kartu Azure, poté Azure SQL Database. Pokračujte výběrem Další.
Výběrem možnosti Vytvořit nové připojenívytvořte připojení ke zdroji dat. Vyplňte na panelu požadované informace o připojení a zadejte AdventureWorksLT pro databázi, ve které jsme vygenerovali slučovací dotaz v toku dat. Pak vyberte Další.
Vyberte tabulku, kterou jste vygenerovali v předchozím kroku toku dat, a pak vyberte Další.
Jako cíl zvolte Azure Blob Storage a pak vyberte Další.
Vytvořte připojení k cíli výběrem možnosti Vytvořit nové připojení. Zadejte podrobnosti o připojení a pak vyberte Další.
Vyberte cestu ke složce a zadejte název souboru a pak vyberte Další.
Vyberte Další znovu a přijměte výchozí formát souboru, oddělovač sloupců a řádků a typ komprese, případně včetně záhlaví.
Dokončete nastavení. Pak zkontrolujte a vyberte Uložit + Spustit, abyste dokončili proces.
Krok 5: Návrh datového kanálu a uložení pro spouštění a načítání dat
Chcete-li spustit aktivitu kopírování po aktivitě toku dat, přetáhněte z Úspěšné na aktivitě toku dat do aktivity kopírování. Aktivita Kopírování se spustí pouze po úspěšném toku dat.
Vyberte Uložit pro uložení vašeho datového kanálu. Pak vyberte Spustit pro spuštění vašeho datového potrubí a načtení dat.
Naplánování spuštění kanálu
Jakmile dokončíte vývoj a testování datového toku, můžete ho naplánovat tak, aby se spustil automaticky.
Na záložce Domů v okně editoru kanálu vyberte možnost Plán.
Podle potřeby nakonfigurujte plán. V tomto příkladu je naplánováno spuštění kanálu denně do konce roku v 18:00.
Související obsah
Tato ukázka ukazuje, jak vytvořit a nakonfigurovat tok dat Gen2 pro vytvoření slučovacího dotazu a jeho uložení do databáze Azure SQL a následné kopírování dat z databáze do textového souboru ve službě Azure Blob Storage. Naučili jste se:
- Vytvořte tok dat.
- Transformujte data pomocí toku dat.
- Vytvořte datový kanál pomocí toku dat.
- Zadejte pořadí provádění kroků v potrubí.
- Kopírování dat pomocí Nástroje pro kopírování
- Spusťte a naplánujte datový pipeline.
V dalším kroku se dozvíte další informace o monitorování spuštění kanálu.