Příprava dat pomocí fondů úloh Apache Sparku v Azure Synapse

Středně pokročilý
Data Engineer
Azure Synapse Analytics

Apache Spark je vysoce škálovatelné řešení distribuovaného zpracování pro analýzu a transformaci velkých objemů dat. Výkon služby Azure Synapse Analytics můžete využít pomocí fondů Spark.

Požadavky

Než začnete s tímto studijním programem, měli byste být obeznámeni se službou Azure Synapse Analytics. Nejprve zvažte dokončení modulu Úvod do služby Azure Synapse Analytics .

Moduly v tomto studijním programu

Apache Spark je základní technologie pro rozsáhlé analýzy dat. Naučte se používat Spark ve službě Azure Synapse Analytics k analýze a vizualizaci dat v datovém jezeře.

Datoví inženýři obvykle potřebují transformovat velké objemy dat. Fondy Apache Sparku ve službě Azure Synapse Analytics poskytují distribuovanou platformu pro zpracování, kterou můžou použít k dosažení tohoto cíle.

Delta Lake je opensourcová oblast relačního úložiště pro Spark, kterou můžete použít k implementaci architektury datového jezera v Azure Synapse Analytics.