Úvod

Dokončeno

Apache Spark je opensourcová architektura paralelního zpracování pro rozsáhlé zpracování a analýzu dat. Spark se stal populárním ve scénářích zpracování velkých objemů dat a je k dispozici v několika implementacích platformy; včetně Azure HDInsight, Azure Synapse Analytics a Microsoft Fabric.

V tomto modulu se dozvíte, jak pomocí Sparku v Microsoft Fabric ingestovat, zpracovávat a analyzovat data v jezeře. I když základní techniky a kód popsané v tomto modulu jsou společné pro všechny implementace Sparku, integrované nástroje a schopnost pracovat se Sparkem ve stejném prostředí jako ostatní datové služby v Microsoft Fabric usnadňují začlenění zpracování dat založených na Sparku do celkového řešení analýzy dat.