Введение
Apache Spark — это платформа с открытым исходным кодом для крупномасштабной обработки и аналитики данных. Apache Spark интегрирован в Microsoft Fabric для предоставления платформы больших данных для аналитики.
Кластеры Fabric Spark предоставляют мощную распределенную платформу в памяти для обработки данных в масштабе. В Microsoft Fabric Spark можно использовать вместе с другими службами аналитики, такими как lakehouses, записные книжки и конвейеры данных.
В этом модуле вы узнаете, как использовать Spark с записными книжками для приема, обработки и анализа данных в Lakehouse Fabric.