Este browser já não é suportado.
Atualize para o Microsoft Edge para tirar partido das mais recentes funcionalidades, atualizações de segurança e de suporte técnico.
Qual definição melhor descreve o Apache Spark?
Um sistema de gerenciamento de banco de dados relacional altamente escalável.
Um servidor virtual com um tempo de execução Python.
Uma plataforma distribuída para processamento paralelo de dados usando vários idiomas.
Você precisa usar o Spark para analisar dados em um arquivo de parquet. O que deve fazer?
Carregue o arquivo parquet em um dataframe.
Importe os dados para uma tabela em um pool SQL sem servidor.
Converta os dados para o formato CSV.
Você deseja escrever código em uma célula do bloco de anotações que usa uma consulta SQL para recuperar dados de um modo de exibição no catálogo do Spark. Qual magia você deve usar?
%faísca
%Pyspark
%SQL
Tem de responder a todas as questões antes de verificar o seu trabalho.
Esta página foi útil?