Transformación de datos con Spark en Azure Synapse Analytics

Intermedio
Ingeniero de datos
Azure Synapse Analytics

Normalmente, los ingenieros de datos necesitan transformar grandes volúmenes de datos. Los grupos de Apache Spark de Azure Synapse Analytics proporcionan una plataforma de procesamiento distribuido que pueden usar para lograr este objetivo.

Objetivos de aprendizaje

En este módulo, aprenderá a lo siguiente:

  • Uso de Apache Spark para modificar y guardar marcos de datos
  • Cree particiones de archivos de datos para mejorar el rendimiento y la escalabilidad.
  • Transformación de datos con SQL

Requisitos previos

Antes de realizar este módulo, debe estar familiarizado con los grupos de Apache Spark en Azure Synapse Analytics. Considere la posibilidad de completar primero el módulo Análisis de datos con Apache Spark en Azure Synapse Analytics.