Azure Databricks を使用して Parquet ファイルを読み取る
この記事では、Azure Databricks を使用して Apache Parquet ファイルからデータを読み取る方法について説明します。
Parquet とは
Apache Parquet は、クエリを最適化して高速化する、列指向ファイル形式です。 CSV や JSON よりも効率的なファイル形式です。
詳細については、Parquet ファイルに関するページを参照してください。
オプション
サポートされる読み取りと書き込みのオプションについては、次の Apache Spark 関連記事を参照してください。
ノートブックの例: Parquet ファイルの読み取りと書き込み
次のノートブックは、Parquet ファイルとの間でデータを読み書きする方法を示しています。