Resumo
O Apache Spark é uma tecnologia-chave usada na transformação de dados e análise de big data. O suporte do Spark no Azure Databricks permite combinar o processamento de big data no Spark com análises de dados em grande escala.
Neste módulo, ficou a saber como:
- Descreva os principais elementos da arquitetura do Apache Spark.
- Crie e configure um cluster do Spark.
- Descreva casos de uso do Spark.
- Use o Spark para processar e analisar dados armazenados em arquivos.
- Use o Spark para visualizar dados.