Transformación de datos con Spark en Azure Synapse Analytics
Normalmente, los ingenieros de datos necesitan transformar grandes volúmenes de datos. Los grupos de Apache Spark de Azure Synapse Analytics proporcionan una plataforma de procesamiento distribuido que pueden usar para lograr este objetivo.
Objetivos de aprendizaje
En este módulo, aprenderá a lo siguiente:
- Uso de Apache Spark para modificar y guardar marcos de datos
- Cree particiones de archivos de datos para mejorar el rendimiento y la escalabilidad.
- Transformación de datos con SQL
Requisitos previos
Antes de realizar este módulo, debe estar familiarizado con los grupos de Apache Spark en Azure Synapse Analytics. Considere la posibilidad de completar primero el módulo Análisis de datos con Apache Spark en Azure Synapse Analytics.