Introdução

Concluído

O Apache Spark é uma estrutura de processamento paralelo de código aberto para processamento e análise de dados em larga escala. O Spark tornou-se popular em cenários de processamento de "big data" e está disponível em várias implementações de plataforma; incluindo o Azure HDInsight, o Azure Synapse Analytics e o Microsoft Fabric.

Este módulo explora como você pode usar o Spark no Microsoft Fabric para ingerir, processar e analisar dados em uma casa de lago. Embora as principais técnicas e o código descritos neste módulo sejam comuns a todas as implementações do Spark, as ferramentas integradas e a capacidade de trabalhar com o Spark no mesmo ambiente que outros serviços de dados no Microsoft Fabric facilitam a incorporação do processamento de dados baseado no Spark em sua solução geral de análise de dados.