Transforme dados com o Spark no Azure Synapse Analytics

Intermédio
Data Engineer
Azure Synapse Analytics

Os engenheiros de dados geralmente precisam transformar grandes volumes de dados. Os pools do Apache Spark no Azure Synapse Analytics fornecem uma plataforma de processamento distribuída que eles podem usar para atingir essa meta.

Objetivos de aprendizagem

Neste módulo, ficará a saber como:

  • Use o Apache Spark para modificar e salvar dataframes
  • Particione arquivos de dados para melhorar o desempenho e a escalabilidade.
  • Transforme dados com SQL

Pré-requisitos

Antes de usar este módulo, você deve estar familiarizado com os pools do Apache Spark no Azure Synapse Analytics. Considere concluir primeiro o módulo Analisar dados com o Apache Spark no Azure Synapse Analytics .