Transforme dados com o Spark no Azure Synapse Analytics
Os engenheiros de dados geralmente precisam transformar grandes volumes de dados. Os pools do Apache Spark no Azure Synapse Analytics fornecem uma plataforma de processamento distribuída que eles podem usar para atingir essa meta.
Objetivos de aprendizagem
Neste módulo, ficará a saber como:
- Use o Apache Spark para modificar e salvar dataframes
- Particione arquivos de dados para melhorar o desempenho e a escalabilidade.
- Transforme dados com SQL
Pré-requisitos
Antes de usar este módulo, você deve estar familiarizado com os pools do Apache Spark no Azure Synapse Analytics. Considere concluir primeiro o módulo Analisar dados com o Apache Spark no Azure Synapse Analytics .