Usar o Apache Spark no Microsoft Fabric
O Apache Spark é uma tecnologia fundamental para a análise de dados em larga escala. O Microsoft Fabric fornece suporte para clusters Spark, permitindo a análise e o processamento de dados em escala em um lakehouse.
Objetivos de aprendizagem
Neste módulo, você aprenderá a:
- Configurar o Spark em um workspace do Microsoft Fabric
- Identificar cenários adequados para notebooks e trabalhos do Spark
- Usar o Spark para se conectar a fontes de dados e ingerir dados
- Usar dataframes do Spark para analisar e transformar dados
- Usar o Spark SQL para consultar dados em tabelas e exibições
- Visualizar dados em um notebook Spark
Pré-requisitos
Para iniciar este módulo, você deve estar familiarizado com a interface do Microsoft Fabric e os principais conceitos.