Deze browser wordt niet meer ondersteund.
Upgrade naar Microsoft Edge om te profiteren van de nieuwste functies, beveiligingsupdates en technische ondersteuning.
Welke definitie beschrijft Apache Spark het beste?
Een zeer schaalbaar relationeel databasebeheersysteem.
Een virtuele server met een Python-runtime.
Een gedistribueerd platform voor parallelle gegevensverwerking met meerdere talen.
U moet Spark gebruiken om gegevens in een Parquet-bestand te analyseren. Wat moet u doen?
Laad het Parquet-bestand in een dataframe.
Importeer de gegevens in een tabel in een serverloze SQL-pool.
Converteer de gegevens naar csv-indeling.
U wilt code schrijven in een notebookcel die gebruikmaakt van een SQL-query om gegevens op te halen uit een weergave in de Spark-catalogus. Welke magie moet je gebruiken?
%%spark
%%pyspark
%%sql
U moet alle vragen beantwoorden voordat uw werk kan worden gecontroleerd.
Is deze pagina nuttig?