Rychlý start: Přesun a transformace dat pomocí toků dat a datových kanálů
V tomto kurzu zjistíte, jak může tok dat a prostředí datového kanálu vytvořit výkonné a komplexní řešení Data Factory.
Požadavky
Abyste mohli začít, musíte mít následující požadavky:
- Účet tenanta s aktivním předplatným. Vytvořte si bezplatný účet.
- Ujistěte se, že máte povolený pracovní prostor Microsoft Fabric: Vytvořte pracovní prostor, který není výchozím pracovním prostorem .
- Databáze Azure SQL s tabulkovými daty
- Účet služby Blob Storage.
Toky dat ve srovnání s kanály
Toky dat Gen2 umožňují využít rozhraní s nízkým kódem a transformace založené na umělé inteligenci a 300+ pro snadné vyčištění, přípravu a transformaci dat s větší flexibilitou než jakýkoli jiný nástroj. Datové kanály umožňují bohaté možnosti orchestrace předefinovaných dat vytvářet flexibilní datové pracovní postupy, které vyhovují potřebám vašeho podniku. V kanálu můžete vytvořit logické seskupení aktivit, které provádějí úlohu, což může zahrnovat volání toku dat k vyčištění a přípravě dat. I když se některé funkce mezi těmito dvěma funkcemi překrývají, výběr, který se má použít pro konkrétní scénář, závisí na tom, jestli požadujete plnou funkčnost kanálů, nebo můžete použít jednodušší, ale omezenější možnosti toků dat. Další podrobnosti najdete v průvodci rozhodováním o prostředcích infrastruktury.
Transformace dat pomocí toků dat
Postupujte podle těchto kroků a nastavte tok dat.
Krok 1: Vytvoření toku dat
Zvolte pracovní prostor s podporou prostředků infrastruktury a pak vyberte Nový. Pak vyberte Dataflow Gen2.
Zobrazí se okno editoru toku dat. Vyberte kartu Importovat z SQL Serveru.
Krok 2: Získání dat
V dialogovém okně Připojení ke zdroji dat, které se zobrazí dále, zadejte podrobnosti pro připojení k databázi Azure SQL a pak vyberte Další. V tomto příkladu použijete ukázkovou databázi AdventureWorksLT nakonfigurovanou při nastavování databáze Azure SQL v požadavcích.
Vyberte data, která chcete transformovat, a pak vyberte Vytvořit. V tomto rychlém startu vyberte SalesLT.Customer z ukázkových dat AdventureWorksLT zadaných pro Azure SQL DB a potom tlačítko Vybrat související tabulky , které automaticky obsahují dvě další související tabulky.
Krok 3: Transformace dat
Pokud není vybraná, vyberte tlačítko Zobrazení diagramu na stavovém řádku v dolní části stránky nebo vyberte zobrazení diagramu v nabídce Zobrazení v horní části editoru Power Query. Některé z těchto možností můžou přepnout zobrazení diagramu.
Klikněte pravým tlačítkem myši na dotaz SalesLT Customer nebo vyberte svislé tři tečky napravo od dotazu a pak vyberte Sloučit dotazy.
Sloučení nakonfigurujte tak , že vyberete tabulku SalesLTOrderHeader jako správnou tabulku pro sloučení, sloupec CustomerID z každé tabulky jako sloupec spojení a levý vnější jako druh spojení. Potom vyberte OK a přidejte slučovací dotaz.
Vyberte tlačítko Přidat cíl dat, které vypadá jako symbol databáze se šipkou nad ní, z nového dotazu hromadné korespondence, který jste právě vytvořili. Pak jako cílový typ vyberte databázi Azure SQL.
Zadejte podrobnosti o připojení k databázi Azure SQL, kde se má publikovat slučovací dotaz. V tomto příkladu můžete použít také databázi AdventureWorksLT , kterou jsme použili jako zdroj dat pro cíl.
Zvolte databázi, do které chcete data uložit, a zadejte název tabulky a pak vyberte Další.
Výchozí nastavení můžete ponechat v dialogovém okně Zvolit nastavení cíle a stačí vybrat Uložit nastavení bez provedení jakýchkoli změn.
Pokud chcete tok dat publikovat, vyberte možnost Publikovat zpět na stránce editoru toku dat.
Přesun dat pomocí datových kanálů
Teď, když jste vytvořili tok dat Gen2, můžete s ním pracovat v kanálu. V tomto příkladu zkopírujete data vygenerovaná z toku dat do textového formátu v účtu služby Azure Blob Storage.
Krok 1: Vytvoření nového datového kanálu
V pracovním prostoru vyberte Nový a pak vyberte Datový kanál.
Pojmenujte svůj kanál a pak vyberte Vytvořit.
Krok 2: Konfigurace toku dat
Výběrem toku dat na kartě Aktivity přidejte do datového kanálu novou aktivitu toku dat.
Vyberte tok dat na plátně kanálu a potom kartu Nastavení. V rozevíracím seznamu vyberte tok dat, který jste vytvořili dříve.
Vyberte Uložit a pak spuštěním spuštění toku dat na začátku naplníte sloučenou tabulku dotazů, kterou jste navrhli v předchozím kroku.
Krok 3: Přidání aktivity kopírování pomocí pomocníka pro kopírování
Začněte tím, že vyberete Kopírovat data na plátně a otevřete nástroj Copy Assistant . Nebo v rozevíracím seznamu Kopírovat data na pásu karet vyberte Použít pomocníka pro kopírování dat.
Vyberte zdroj dat tak, že vyberete typ zdroje dat. V tomto kurzu použijete Službu Azure SQL Database použitou dříve při vytváření toku dat k vygenerování nového slučovacího dotazu. Posuňte se dolů pod ukázkové nabídky dat a vyberte kartu Azure a pak Azure SQL Database. Pokračujte výběrem možnosti Další .
Výběrem možnosti Vytvořit nové připojení vytvořte připojení ke zdroji dat. Vyplňte požadované informace o připojení na panelu a zadejte AdventureWorksLT pro databázi, kde jsme vygenerovali slučovací dotaz v toku dat. Pak vyberte Další.
Vyberte tabulku, kterou jste vygenerovali v předchozím kroku toku dat, a pak vyberte Další.
Jako cíl zvolte Azure Blob Storage a pak vyberte Další.
Výběrem možnosti Vytvořit nové připojení vytvořte připojení k cíli. Zadejte podrobnosti o připojení a pak vyberte Další.
Vyberte cestu ke složce a zadejte název souboru a pak vyberte Další.
Dalším výběrem možnosti Další přijměte výchozí formát souboru, oddělovač sloupců, oddělovač řádků a typ komprese, volitelně včetně záhlaví.
Dokončete nastavení. Pak proces dokončete tak, že zkontrolujete a vyberete Uložit a spustit .
Krok 5: Návrh datového kanálu a uložení pro spouštění a načítání dat
Chcete-li spustit aktivitu kopírování po aktivitě toku dat, přetáhněte z úspěšné aktivity toku dat do aktivity kopírování. Aktivita kopírování se spustí pouze po úspěšném provedení aktivity toku dat.
Vyberte Uložit a uložte datový kanál. Pak vyberte Spustit a spusťte datový kanál a načtěte data.
Naplánování spuštění kanálu
Jakmile dokončíte vývoj a testování kanálu, můžete ho naplánovat tak, aby se spustil automaticky.
Na kartě Domů v okně editoru kanálu vyberte Plán.
Podle potřeby nakonfigurujte plán. V tomto příkladu je naplánováno spuštění kanálu denně do konce roku v 18:00.
Související obsah
Tato ukázka ukazuje, jak vytvořit a nakonfigurovat tok dat Gen2 pro vytvoření slučovacího dotazu a jeho uložení do databáze Azure SQL a následné kopírování dat z databáze do textového souboru ve službě Azure Blob Storage. Naučili jste se:
- Vytvoření toku dat.
- Transformujte data pomocí toku dat.
- Vytvořte datový kanál pomocí toku dat.
- Seřazení provádění kroků v kanálu
- Kopírování dat pomocí Nástroje pro kopírování
- Spusťte a naplánujte datový kanál.
V dalším kroku se dozvíte další informace o monitorování spuštění kanálu.