Introdução

1 minuto

O Apache Spark é uma estrutura de processamento paralelo de código aberto para processamento e análise de dados em larga escala. O Spark tornou-se popular em cenários de processamento de "Big Data" e está disponível em várias implementações de plataforma, incluindo o Azure HDInsight, o Azure Synapse Analytics e o Microsoft Fabric.

Este módulo explica como usar o Spark no Microsoft Fabric para ingerir, processar e analisar dados em um lakehouse. Embora as principais técnicas e o código descritos neste módulo sejam comuns a todas as implementações do Spark, as ferramentas integradas e a capacidade de trabalhar com o Spark no mesmo ambiente que outros serviços de dados no Microsoft Fabric facilitam a incorporação do processamento de dados baseado em Spark em sua solução geral de análise de dados.

Introdução

Comentários