Zkoumání a transformace dat v jezeře

Dokončeno

Transformace a načítání dat

Většina dat před načtením do tabulek vyžaduje transformace. Nezpracovaná data můžete ingestovat přímo do jezera a pak je dále transformovat a načíst do tabulek. Bez ohledu na návrh ETL můžete transformovat a načítat data jednoduše pomocí stejných nástrojů k ingestování dat. Transformovaná data je pak možné načíst jako soubor nebo tabulku Delta.

  • Poznámkové bloky preferují datoví inženýři, kteří znají různé programovací jazyky, včetně PySpark, SQL a Scala.
  • Toky dat Gen2 jsou vynikající pro vývojáře, kteří znají Power BI nebo Excel, protože používají rozhraní PowerQuery.
  • Kanály poskytují vizuální rozhraní pro provádění a orchestraci procesů ETL. Kanály můžou být stejně jednoduché nebo složité, jak potřebujete.

Analýza a vizualizace dat v jezeře

Jakmile se data ingestují, transformují a načtou, jsou připravená k použití jiným uživatelům. Položky infrastruktury poskytují flexibilitu potřebnou pro každou organizaci, abyste mohli používat nástroje, které vám fungují.

  • Datoví vědci můžou k prozkoumání a trénování modelů strojového učení pro AI použít poznámkové bloky nebo transformaci dat.
  • Vývojáři sestav můžou k vytváření sestav Power BI použít sémantický model.
  • Analytici můžou pomocí koncového bodu analýzy SQL dotazovat, filtrovat, agregovat a jinak zkoumat data v tabulkách lakehouse.

Kombinací možností vizualizace dat v Power BI s centralizovaným úložištěm a tabulkovým schématem datového jezerahouse můžete implementovat komplexní analytické řešení na jedné platformě.