Příprava dat pomocí fondů úloh Apache Sparku v Azure Synapse
Apache Spark je vysoce škálovatelné řešení distribuovaného zpracování pro analýzu a transformaci velkých objemů dat. Výkon služby Azure Synapse Analytics můžete využít pomocí fondů Spark.
Požadavky
Než začnete s tímto studijním programem, měli byste být obeznámeni se službou Azure Synapse Analytics. Nejprve zvažte dokončení modulu Úvod do služby Azure Synapse Analytics .
Kód dosaženého cíle
Chcete požádat o kód cíle?
Moduly v tomto studijním programu
Apache Spark je základní technologie pro rozsáhlé analýzy dat. Naučte se používat Spark ve službě Azure Synapse Analytics k analýze a vizualizaci dat v datovém jezeře.
Datoví inženýři obvykle potřebují transformovat velké objemy dat. Fondy Apache Sparku ve službě Azure Synapse Analytics poskytují distribuovanou platformu pro zpracování, kterou můžou použít k dosažení tohoto cíle.
Delta Lake je opensourcová oblast relačního úložiště pro Spark, kterou můžete použít k implementaci architektury datového jezera v Azure Synapse Analytics.