Sdílet prostřednictvím


Rychlý start: Přesun a transformace dat pomocí toků dat a datových kanálů

V tomto kurzu zjistíte, jak může tok dat a prostředí datového kanálu vytvořit výkonné a komplexní řešení Data Factory.

Požadavky

Abyste mohli začít, musíte mít následující požadavky:

Toky dat ve srovnání s potrubími

Datové toky Gen2 vám umožňují používat rozhraní s nízkým kódem a více než 300 transformací založených na datech a umělé inteligenci, abyste mohli snadno čistit, připravovat a transformovat data s větší flexibilitou než jakýkoli jiný nástroj. Datové kanály umožňují bohaté předem připravené možnosti orchestrace dat, které vám umožní sestavovat flexibilní datové pracovní postupy, jež vyhovují potřebám vašeho podniku. V pipeline můžete vytvořit logické seskupení aktivit, které provádějí úlohu, což může zahrnovat volání služby Dataflow k vyčištění a přípravě vašich dat. I když se některé funkce mezi těmito dvěma funkcemi překrývají, výběr, který se má použít pro konkrétní scénář, závisí na tom, jestli požadujete plnou bohatost kanálů, nebo můžete použít jednodušší, ale omezenější možnosti toků dat. Další informace najdete v příručce pro rozhodování o Fabric

Transformace dat pomocí toků dat

Postupujte podle těchto kroků a nastavte tok dat.

Krok 1: Vytvoření toku dat

  1. Zvolte pracovní prostor s podporou Fabric, a pak vyberte Nový. Pak vyberte Dataflow Gen2.

    snímek obrazovky ukazující, kde začít vytvářet tok dat Gen2

  2. Zobrazí se okno editoru toku dat. Vyberte kartu Importovat ze SQL Serveru.

    Snímek obrazovky s oknem editoru toku dat

Krok 2: Získání dat

  1. V dialogovém okně Připojit ke zdroji dat níže zadejte podrobnosti pro připojení k databázi Azure SQL a pak vyberte Další. V tomto příkladu použijete ukázkovou databázi AdventureWorksLT nakonfigurovanou při nastavování databáze Azure SQL v rámci předpokladů.

    snímek obrazovky ukazující, jak se připojit k databázi Azure SQL

  2. Vyberte data, která chcete transformovat, a pak vyberte Vytvořit. Pro tento rychlý start vyberte SalesLT.Customer z ukázkových dat AdventureWorksLT poskytnutých pro Azure SQL DB a poté vyberte tlačítko Vybrat související tabulky pro automatické zahrnutí dvou dalších souvisejících tabulek.

    Snímek obrazovky znázorňující, kde si vybrat z dostupných dat

Krok 3: Transformace dat

  1. Pokud není vybrán, zvolte tlačítko Zobrazení diagramu na stavovém řádku ve spodní části stránky nebo zvolte Zobrazení diagramu v nabídce Zobrazení v horní části editoru Power Query. Některé z těchto možností můžou přepnout zobrazení diagramu.

    Snímek obrazovky znázorňující, kde vybrat zobrazení diagramu

  2. Klikněte pravým tlačítkem na dotaz SalesLT Customer, nebo vyberte svislou elipsu napravo od dotazu, a poté vyberte Sloučit dotazy.

    Snímek obrazovky ukazující, kde najít možnost Sloučit dotazy

  3. Sloučení nakonfigurujte tak, že vyberete tabulku SalesLTOrderHeader jako správnou tabulku pro sloučení, sloupec CustomerID z každé tabulky jako sloupec spojení a levý vnější jako druh spojení. Potom výběrem OK přidejte slučovací dotaz.

    snímek obrazovky s konfigurací sloučení

  4. Vyberte tlačítko Přidat cíl dat, které vypadá jako symbol databáze se šipkou nad ním, z nového sloučeného dotazu, který jste vytvořili. Pak jako cílový typ vyberte databáze Azure SQL.

    Snímek obrazovky se zvýrazněním tlačítka Přidat cíl dat v nově vytvořeném slučovacím dotazu

  5. Zadejte podrobnosti o připojení k databázi Azure SQL, kde se má publikovat slučovací dotaz. V tomto příkladu můžete použít také databázi AdventureWorksLT, kterou jsme použili jako zdroj dat pro cíl.

    Snímek obrazovky s dialogovým oknem Připojení k datovému cíli s vyplněnými ukázkovými hodnotami

  6. Zvolte databázi, do které chcete uložit data, a zadejte název tabulky a pak vyberte Další.

    Snímek obrazovky s oknem Zvolit cílový cíl

  7. Výchozí nastavení můžete ponechat v dialogovém okně Zvolte nastavení cíle a stačí vybrat Uložit nastavení beze změn.

    Snímek obrazovky s dialogovým oknem Zvolit nastavení cíle

  8. Pokud chcete tok dat publikovat, vyberte Publikovat zpět na stránce editoru toku dat.

    Snímek obrazovky se zvýrazněním tlačítka Publikovat v editoru toku dat Gen2

Přesun dat pomocí datových kanálů

Nyní, když jste vytvořili Dataflow Gen2, můžete s ním pracovat v datovém kanálu. V tomto příkladu zkopírujete data vygenerovaná z toku dat do textového formátu v účtu služby Azure Blob Storage.

Krok 1: Vytvoření nového datového kanálu

  1. V pracovním prostoru vyberte Novýa pak vyberte datový kanál.

    Snímek obrazovky ukazující, kde spustit nový datový kanál

  2. Pojmenujte kanál a pak vyberte Vytvořit.

    snímek obrazovky s výzvou k vytvoření nového kanálu s názvem ukázkového kanálu

Krok 2: Konfigurace toku dat

  1. Přidejte do datového kanálu novou aktivitu toku dat výběrem na kartě Aktivity.

    Snímek obrazovky znázorňující, kde vybrat možnost Tok dat

  2. Vyberte tok dat na plátně potrubí a pak kartu Nastavení. V rozevíracím seznamu vyberte tok dat, který jste vytvořili dříve.

    Snímek obrazovky znázorňující, jak zvolit tok dat, který jste vytvořili

  3. Vyberte Uložita potom Spustit, aby se tok dat spustil, aby se na začátku naplnila sloučená tabulka dotazů, kterou jste navrhli v předchozím kroku.

    snímek obrazovky znázorňující, kde vybrat Spustit

Krok 3: Přidání aktivity kopírování pomocí pomocníka pro kopírování

  1. Vyberte Kopírovat data na plátně a otevřete nástroj Copy Assistant, abyste mohli začít. Nebo vyberte Použít pomocníka pro kopírování z rozevíracího seznamu Kopírování dat pod kartou Aktivity na pásu karet.

    Snímek obrazovky znázorňující dva způsoby přístupu k pomocníkovi pro kopírování

  2. Vyberte zdroj dat tak, že vyberete typ zdroje dat. V tomto kurzu použijete Službu Azure SQL Database použitou dříve při vytváření toku dat k vygenerování nového slučovacího dotazu. Posuňte se dolů pod ukázkové nabídky dat a vyberte kartu Azure, poté Azure SQL Database. Pokračujte výběrem Další.

    Snímek obrazovky znázorňující, kde zvolit zdroj dat

  3. Výběrem možnosti Vytvořit nové připojenívytvořte připojení ke zdroji dat. Vyplňte na panelu požadované informace o připojení a zadejte AdventureWorksLT pro databázi, ve které jsme vygenerovali slučovací dotaz v toku dat. Pak vyberte Další.

    snímek obrazovky znázorňující, kde vytvořit nové připojení

  4. Vyberte tabulku, kterou jste vygenerovali v předchozím kroku toku dat, a pak vyberte Další.

    Snímek obrazovky znázorňující výběr z dostupných tabulek

  5. Jako cíl zvolte Azure Blob Storage a pak vyberte Další.

    snímek obrazovky znázorňující cíl dat služby Azure Blob Storage

  6. Vytvořte připojení k cíli výběrem možnosti Vytvořit nové připojení. Zadejte podrobnosti o připojení a pak vyberte Další.

    Snímek obrazovky znázorňující, jak vytvořit připojení

  7. Vyberte cestu ke složce a zadejte název souboru a pak vyberte Další.

    Snímek obrazovky ukazující, jak vybrat cestu ke složce a název souboru

  8. Vyberte Další znovu a přijměte výchozí formát souboru, oddělovač sloupců a řádků a typ komprese, případně včetně záhlaví.

    snímek obrazovky znázorňující možnosti konfigurace souboru ve službě Azure Blob Storage

  9. Dokončete nastavení. Pak zkontrolujte a vyberte Uložit + Spustit, abyste dokončili proces.

    Snímek obrazovky znázorňující, jak zkontrolovat nastavení kopírování dat

Krok 5: Návrh datového kanálu a uložení pro spouštění a načítání dat

  1. Chcete-li spustit aktivitu kopírování po aktivitě toku dat, přetáhněte z Úspěšné na aktivitě toku dat do aktivity kopírování. Aktivita Kopírování se spustí pouze po úspěšném toku dat.

    snímek obrazovky znázorňující, jak provést spuštění toku dat po aktivitě kopírování

  2. Vyberte Uložit pro uložení vašeho datového kanálu. Pak vyberte Spustit pro spuštění vašeho datového potrubí a načtení dat.

    Snímek obrazovky ukazující, kde vybrat Uložit a Spustit

Naplánování spuštění kanálu

Jakmile dokončíte vývoj a testování datového toku, můžete ho naplánovat tak, aby se spustil automaticky.

  1. Na záložce Domů v okně editoru kanálu vyberte možnost Plán.

    snímek obrazovky s tlačítkem Plán v nabídce na kartě Domů v editoru kanálů.

  2. Podle potřeby nakonfigurujte plán. V tomto příkladu je naplánováno spuštění kanálu denně do konce roku v 18:00.

    snímek obrazovky znázorňující konfiguraci plánu pro kanál, který se má spouštět denně v 8:00 do konce roku

Tato ukázka ukazuje, jak vytvořit a nakonfigurovat tok dat Gen2 pro vytvoření slučovacího dotazu a jeho uložení do databáze Azure SQL a následné kopírování dat z databáze do textového souboru ve službě Azure Blob Storage. Naučili jste se:

  • Vytvořte tok dat.
  • Transformujte data pomocí toku dat.
  • Vytvořte datový kanál pomocí toku dat.
  • Zadejte pořadí provádění kroků v potrubí.
  • Kopírování dat pomocí Nástroje pro kopírování
  • Spusťte a naplánujte datový pipeline.

V dalším kroku se dozvíte další informace o monitorování spuštění kanálu.