Mapování dat ve službě Azure Synapse Analytics
Co je nástroj Mapování dat?
Nástroj Mapování dat je asistovaný proces, který uživatelům pomáhá vytvářet mapování ETL a mapování toků dat ze zdrojových dat do tabulek databáze Synapse Lake bez nutnosti psát kód. Tento proces začíná výběrem cílových tabulek v databázích Synapse Lake a následným mapováním jejich zdrojových dat do těchto tabulek.
Další informace o databázích Synapse Lake najdete v tématu Přehled šablon databází Azure Synapse – Azure Synapse Analytics | Microsoft Docs
Mapování dat umožňuje uživatelům vytvářet mapování toku dat s asistencí, aniž by museli začínat úplně od začátku. Pak můžete rychle vygenerovat škálovatelné mapování toku dat, které lze spustit v kanálech Synapse.
Začínáme
Nástroj Map data se spouští v prostředí databáze Synapse Lake. Tady můžete vybrat nástroj Mapovat data a zahájit proces.
Mapová data potřebují k dispozici výpočetní prostředky, které uživatelům pomůžou s náhledem dat a čtením schématu zdrojových souborů. Při prvním použití mapových dat v relaci budete muset cluster zahřát.
Začněte tím, že zvolíte zdroj dat, který chcete namapovat na tabulky databáze Lake. Aktuálně podporované zdroje dat jsou Azure Data Lake Storage databáze Gen 2 a Synapse Lake.
Možnosti typu souboru
Při výběru úložiště souborů, jako je například Azure Data Lake Storage Gen2, jsou podporovány následující typy souborů:
- Common Data Model
- Text s oddělovači
- Parquet
Vytvoření mapování dat
Nakonfigurujte mapování dat pomocí vybraného zdrojového typu.
Poznámka
Můžete vybrat složku nebo jednotlivý soubor. Pokud zvolíte složku, budete moct do tabulek databáze Lake namapovat více souborů. Pokud vyberete složku, budete také po výběru možnosti Pokračovat vyzváni, abyste v případě potřeby zahrnuli pouze konkrétní soubory.
Pojmenujte mapování dat a vyberte cílovou databázi Synapse Lake.
Mapování zdroje na cíl
Zvolte primární zdrojovou tabulku, která se má mapovat na cílovou tabulku databáze Synapse Lake.
Nové mapování
Pomocí tlačítka Nové mapování přidejte metodu mapování pro vytvoření mapování nebo transformace.
Další zdroj
Pomocí tlačítka Další zdroj se připojte k mapování a přidejte do mapování další zdroj.
Náhled dat
Karta Náhled dat poskytuje interaktivní snímek dat každé transformace. Další informace najdete v tématu Náhled dat v režimu ladění.
Metody mapování
Podporují se následující metody mapování:
- Direct
- Náhradní klíč
- Vyhledávání
- Převést na řádky
-
Agregace
- Sum
- Minimum
- Maximum
- První
- Poslední
- Směrodatná odchylka
- Průměr
- Mean
-
Odvozený sloupec
- Trim
- Upper
- Nižší
- Pokročilý
Vytvoření kanálu
Po dokončení transformací mapových dat vyberte tlačítko Vytvořit kanál a vygenerujte tok dat mapování a kanál pro ladění a spuštění transformace.