Resumen
Apache Spark es una tecnología clave que se usa en la transformación de datos y el análisis de macrodatos. El soporte con Spark en Azure Databricks le habilita combinar el procesamiento de macrodatos en Spark con análisis de datos a gran escala.
En este módulo ha aprendido a:
- Describir los elementos clave de la arquitectura de Apache Spark.
- Cree y configure un clúster de Spark.
- Describir los casos de uso de Spark.
- Use Spark para procesar y analizar los datos almacenados en archivos.
- Use Spark para visualizar los datos.