Uso de Apache Spark en Azure Databricks
Azure Databricks se basa en Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.
Objetivos de aprendizaje
En este módulo aprenderá a:
- Describir los elementos clave de la arquitectura de Apache Spark.
- Cree y configure un clúster de Spark.
- Describir los casos de uso de Spark.
- Use Spark para procesar y analizar los datos almacenados en archivos.
- Use Spark para visualizar los datos.
Requisitos previos
Antes de iniciar este módulo, debe tener conocimientos básicos de Azure Databricks. Considere la posibilidad de completar el módulo Explorar Azure Databricks antes de este.