Usar Apache Spark no Azure Databricks
O Azure Databricks é baseado no Apache Spark e permite que engenheiros de dados e analistas executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.
Objetivos de aprendizagem
Neste módulo, você aprenderá a:
- Descreva os principais elementos da arquitetura do Apache Spark.
- Crie e configure um cluster do Spark.
- Descreva casos de uso do Spark.
- Use o Spark para processar e analisar dados armazenados em arquivos.
- Usar o Spark para visualizar dados.
Pré-requisitos
Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explorar o Azure Databricks antes deste.