Zkoumání a transformace dat v jezeře
Transformace a načítání dat
Většina dat před načtením do tabulek vyžaduje transformace. Nezpracovaná data můžete ingestovat přímo do jezera a pak je dále transformovat a načíst do tabulek. Bez ohledu na návrh ETL můžete transformovat a načítat data jednoduše pomocí stejných nástrojů k ingestování dat. Transformovaná data je pak možné načíst jako soubor nebo tabulku Delta.
- Poznámkové bloky preferují datoví inženýři, kteří znají různé programovací jazyky, včetně PySpark, SQL a Scala.
- Toky dat Gen2 jsou vynikající pro vývojáře, kteří znají Power BI nebo Excel, protože používají rozhraní PowerQuery.
- Kanály poskytují vizuální rozhraní pro provádění a orchestraci procesů ETL. Kanály můžou být stejně jednoduché nebo složité, jak potřebujete.
Analýza a vizualizace dat v jezeře
Jakmile se data ingestují, transformují a načtou, jsou připravená k použití jiným uživatelům. Položky infrastruktury poskytují flexibilitu potřebnou pro každou organizaci, abyste mohli používat nástroje, které vám fungují.
- Datoví vědci můžou k prozkoumání a trénování modelů strojového učení pro AI použít poznámkové bloky nebo transformaci dat.
- Vývojáři sestav můžou k vytváření sestav Power BI použít sémantický model.
- Analytici můžou pomocí koncového bodu analýzy SQL dotazovat, filtrovat, agregovat a jinak zkoumat data v tabulkách lakehouse.
Kombinací možností vizualizace dat v Power BI s centralizovaným úložištěm a tabulkovým schématem datového jezerahouse můžete implementovat komplexní analytické řešení na jedné platformě.