Этот браузер больше не поддерживается.
Выполните обновление до Microsoft Edge, чтобы воспользоваться новейшими функциями, обновлениями для системы безопасности и технической поддержкой.
Какое определение лучше всего описывает Apache Spark?
Высокомасштабируемая система управления реляционными базами данных.
Виртуальный сервер со средой выполнения Python.
Распределенная платформа для параллельной обработки данных с использованием нескольких языков.
Необходимо использовать Spark для анализа данных в файле Parquet. Что вы должны сделать?
Загрузите файл Parquet в кадр данных.
Импортируйте данные в таблицу в бессерверном пуле SQL.
Преобразование данных в формат CSV.
Напишите код в ячейке записной книжки, которая использует запрос SQL для получения данных из представления в каталоге Spark. Какую магическую команду следует использовать для этого?
%%spark
%%pyspark
%%sql
Вы должны ответить на все вопросы перед проверкой.
Были ли сведения на этой странице полезными?