Realización de tareas de ingeniería de datos con grupos de Apache Spark en Azure Synapse
Apache Spark es una solución de procesamiento distribuido altamente escalable para el análisis y la transformación de macrodatos. Puede aprovechar su eficacia en Azure Synapse Analytics mediante grupos de Spark.
Requisitos previos
Antes de empezar esta ruta de aprendizaje, tiene que haberse familiarizado con Azure Synapse Analytics. Considere la posibilidad de completar antes el módulo Introducción a Azure Synapse Analytics.
Código de logros
¿Desea solicitar un código de logro?
Módulos en esta ruta de aprendizaje
Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Aprenda a usar Spark en Azure Synapse Analytics para analizar y visualizar datos en un lago de datos.
Normalmente, los ingenieros de datos necesitan transformar grandes volúmenes de datos. Los grupos de Apache Spark de Azure Synapse Analytics proporcionan una plataforma de procesamiento distribuido que pueden usar para lograr este objetivo.
Delta Lake es un área de almacenamiento relacional de código abierto para Spark que puede usar para implementar una arquitectura de lago de datos en Azure Synapse Analytics.