Úvod

1 min.

Apache Spark poskytuje výkonnou platformu pro provádění úloh čištění a transformace dat na velkých objemech dat. Pomocí objektu datového rámce Sparku můžete snadno načíst data ze souborů v datovém jezeře a provádět složité úpravy. Transformovaná data pak můžete uložit zpět do datového jezera pro zpracování v rámci podřízeného zpracování nebo příjmu dat do datového skladu.

Azure Synapse Analytics poskytuje fondy Apache Sparku, které můžete použít ke spouštění úloh Sparku k transformaci dat v rámci úlohy příjmu a přípravy dat. Nativně podporované poznámkové bloky můžete použít k zápisu a spuštění kódu ve fondu Sparku k přípravě dat na analýzu. K práci s transformovanými daty pak můžete použít další funkce Azure Synapse Analytics, jako jsou fondy SQL.

Úvod

Váš názor