Tento prohlížeč se už nepodporuje.
Upgradujte na Microsoft Edge, abyste mohli využívat nejnovější funkce, aktualizace zabezpečení a technickou podporu.
Která definice nejlépe popisuje Apache Spark?
Vysoce škálovatelný systém pro správu relačních databází.
Virtuální server s modulem runtime Pythonu.
Distribuovaná platforma pro paralelní zpracování dat pomocí více jazyků.
K analýze dat v souboru parquet musíte použít Spark. Co byste měli udělat?
Načtěte soubor parquet do datového rámce.
Importuje data do tabulky v bezserverovém fondu SQL.
Převeďte data do formátu CSV.
Chcete napsat kód do buňky poznámkového bloku, který používá dotaz SQL k načtení dat ze zobrazení v katalogu Spark. Jakou magii byste měli použít?
%%spark
%%pyspark
%%sql
Před kontrolou vaší práce musíte odpovědět na všechny dotazy.
Byla tato stránka užitečná?