Usar o Apache Spark no Microsoft Fabric

Intermediário
Analista de Dados
Engenheiro de dados
Microsoft Fabric

O Apache Spark é uma tecnologia fundamental para a análise de dados em larga escala. O Microsoft Fabric fornece suporte para clusters Spark, permitindo a análise e o processamento de dados em escala em um lakehouse.

Objetivos de aprendizagem

Neste módulo, você aprenderá a:

  • Configurar o Spark em um workspace do Microsoft Fabric

  • Identificar cenários adequados para notebooks e trabalhos do Spark

  • Usar dataframes do Spark para analisar e transformar dados

  • Usar o Spark SQL para consultar dados em tabelas e exibições

  • Visualizar dados em um notebook Spark

Pré-requisitos

Para iniciar este módulo, você deve estar familiarizado com a interface do Microsoft Fabric e os principais conceitos.