Introdução

Concluído

O Apache Spark é uma estrutura de código aberto para processamento e análise de dados em larga escala. O Apache Spark é integrado ao Microsoft Fabric para fornecer uma plataforma de Big Data para análise.

Os clusters do Spark no Fabric fornecem uma estrutura distribuída avançada na memória para processamento de dados em escala. No Microsoft Fabric, o Spark pode ser usado junto com outros serviços de análise, como lakehouses, notebooks e pipelines de dados.

Neste módulo, você explora como usar o Spark com notebooks para ingerir, processar e analisar dados em um Lakehouse do Fabric.