Transformación de datos con Spark en Azure Synapse Analytics

Módulo
7 Unidades

Intermedio

Ingeniero de datos

Azure Synapse Analytics

Normalmente, los ingenieros de datos necesitan transformar grandes volúmenes de datos. Los grupos de Apache Spark de Azure Synapse Analytics proporcionan una plataforma de procesamiento distribuido que pueden usar para lograr este objetivo.

Objetivos de aprendizaje

En este módulo, aprenderá a lo siguiente:

Uso de Apache Spark para modificar y guardar marcos de datos
Cree particiones de archivos de datos para mejorar el rendimiento y la escalabilidad.
Transformación de datos con SQL

Requisitos previos

Antes de realizar este módulo, debe estar familiarizado con los grupos de Apache Spark en Azure Synapse Analytics. Considere la posibilidad de completar primero el módulo Análisis de datos con Apache Spark en Azure Synapse Analytics.

Introducción min
Modificación y guardado de marcos de datos min
Creación de particiones de archivos de datos min
Transformación de datos con SQL min
Ejercicio: Transformación de datos con Spark en Azure Synapse Analytics min
Prueba de conocimientos min
Resumen min