Lesen von Parquet-Dateien mit Azure Databricks
Dieser Artikel erklärt, wie Sie Daten aus Parquet-Dateien mithilfe von Azure Databricks lesen.
Was ist Parquet?
Apache Parquet ist ein spaltenbasiertes Dateiformat mit Optimierungen zur Beschleunigung von Abfragen. Dieses Dateiformat ist effizienter als CSV oder JSON.
Weitere Informationen finden Sie unter Parquet-Dateien.
Optionen
Die unterstützten Optionen für Lesen und Schreiben finden Sie in den folgenden Apache Spark-Referenzartikeln.
Notebookbeispiel: Lesen und Schreiben in Parquet-Dateien
Im folgenden Notebook wird gezeigt, wie Sie Daten in Parquet-Dateien lesen und schreiben können.