Co jsou toky dat ve službě Azure Synapse Analytics?
Toky dat jsou vizuálně navržené transformace dat ve službě Azure Synapse Analytics. Toky dat umožňují datovým inženýrům vyvíjet logiku transformace dat bez psaní kódu. Výsledné toky dat se spouští jako aktivity v kanálech Azure Synapse Analytics, které používají clustery Apache Spark se škálováním na více systémů. Aktivity toku dat je možné zprovoznit pomocí stávajících možností plánování, řízení, toku a monitorování azure Synapse Analytics.
Toky dat poskytují zcela vizuální prostředí bez nutnosti kódování. Toky dat běží na clusterech spouštění spravovaných službou Synapse pro zpracování dat se škálováním na více instancí. Azure Synapse Analytics zpracovává veškerý překlad kódu, optimalizaci cesty a provádění úloh toku dat.
Začínáme
Toky dat se vytvářejí z podokna Vývoj v nástroji Synapse Studio. Pokud chcete vytvořit tok dat, vyberte znaménko plus vedle možnosti Vývoj a pak vyberte Tok dat.
Tato akce vás provede na plátno toku dat, kde můžete vytvořit logiku transformace. Výběrem možnosti Přidat zdroj zahájíte konfiguraci transformace zdroje. Další informace najdete v tématu Transformace zdroje.
Vytváření toků dat
Tok dat má jedinečné plátno pro vytváření, které je navržené tak, aby bylo vytváření logiky transformace snadné. Plátno toku dat je rozděleno do tří částí: horní panel, graf a konfigurační panel.
Graf
Graf zobrazuje stream transformace. Zobrazuje rodokmen zdrojových dat při jejich toku do jednoho nebo více jímek. Pokud chcete přidat nový zdroj, vyberte Přidat zdroj. Pokud chcete přidat novou transformaci, vyberte znaménko plus v pravém dolním rohu existující transformace. Přečtěte si další informace o správě grafu toku dat.
Konfigurační panel
Na konfiguračním panelu se zobrazí nastavení specifická pro aktuálně vybranou transformaci. Pokud není vybrána žádná transformace, zobrazí se tok dat. V konfiguraci celkového toku dat můžete přidat parametry prostřednictvím karty Parametry . Další informace najdete v tématu Parametry toku dat.
Každá transformace obsahuje aspoň čtyři karty konfigurace.
Nastavení transformace
První karta v podokně konfigurace každé transformace obsahuje nastavení specifická pro danou transformaci. Další informace najdete na stránce dokumentace k transformaci.
Optimalizovat
Karta Optimalizovat obsahuje nastavení pro konfiguraci schémat dělení. Další informace o tom, jak optimalizovat toky dat, najdete v průvodci výkonem mapování toku dat.
Inspekce
Karta Kontrola poskytuje zobrazení metadat datového streamu, který transformujete. Můžete zobrazit počty sloupců, změněné sloupce, přidané sloupce, datové typy, pořadí sloupců a odkazy na sloupce. Kontrola je zobrazení metadat jen pro čtení. Pokud chcete zobrazit metadata v podokně Kontrola , nemusíte mít povolený režim ladění.
Když změníte tvar dat prostřednictvím transformací, uvidíte tok změn metadat v podokně Kontrola . Pokud ve zdrojové transformaci neexistuje definované schéma, metadata se v podokně Kontrola nezobrazují. Nedostatek metadat je běžný ve scénářích posunu schématu.
Náhled dat
Pokud je zapnutý režim ladění, na kartě Náhled dat získáte interaktivní snímek dat v každé transformaci. Další informace najdete v tématu Náhled dat v režimu ladění.
Horní panel
Horní panel obsahuje akce, které ovlivňují celý tok dat, jako jsou nastavení ověřování a ladění. Můžete si také prohlédnout základní kód JSON a skript toku dat logiky transformace.
Dostupné transformace
Zobrazte si přehled transformace toku dat mapování a získejte seznam dostupných transformací.
Aktivita toku dat
Toky dat se zprovozní v rámci kanálů Azure Synapse Analytics pomocí aktivity toku dat. Vše, co musí uživatel udělat, je určit, které prostředí Integration Runtime se má použít, a předat hodnoty parametrů. Další informace najdete v prostředí Azure Integration Runtime.
Režim ladění
Režim ladění umožňuje interaktivně zobrazit výsledky jednotlivých kroků transformace při sestavování a ladění toků dat. Ladicí relaci je možné použít jak při vytváření logiky toku dat, tak při spouštění ladicí běhů kanálu s aktivitami toku dat. Další informace najdete v dokumentaci k režimu ladění.
Monitorování toků dat
Tok dat se integruje se stávajícími možnostmi monitorování služby Azure Synapse Analytics. Informace o tom, jak porozumět výstupu monitorování toku dat, najdete v tématu monitorování mapování toků dat.
Tým Azure Synapse Analytics vytvořil průvodce laděním výkonu, který vám pomůže optimalizovat dobu provádění toků dat po vytvoření obchodní logiky.
Související obsah
- Zjistěte, jak vytvořit zdrojovou transformaci.
- Naučte se vytvářet toky dat v režimu ladění.