Usar Apache Spark no Azure Databricks

Módulo
9 Unidades

Intermediário

Engenheiro de dados

Azure Databricks

O Azure Databricks é baseado no Apache Spark e permite que engenheiros de dados e analistas executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

Objetivos de aprendizagem

Neste módulo, você aprenderá a:

Descreva os principais elementos da arquitetura do Apache Spark.
Crie e configure um cluster do Spark.
Descreva casos de uso do Spark.
Use o Spark para processar e analisar dados armazenados em arquivos.
Usar o Spark para visualizar dados.

Pré-requisitos

Antes de iniciar este módulo, você deve ter um conhecimento básico do Azure Databricks. Considere concluir o módulo Explorar o Azure Databricks antes deste.

Introdução min
Conhecer o Spark min
Criar um cluster Spark min
Usar o Spark em notebooks min
Usar o Spark para trabalhar com arquivos de dados min
Visualizar dados min
Exercício – Usar o Spark no Azure Databricks min
Verificação de conhecimentos min
Resumo min