Lire des fichiers Parquet à l’aide d’Azure Databricks
Découvrez comment lire des données à partir de fichiers Apache Parquet à l’aide d’Azure Databricks.
Qu’est-ce que Parquet ?
Apache Parquet est un format de fichier en colonnes qui fournit des optimisations pour accélérer les requêtes. Il s’agit d’un format de fichier beaucoup plus efficace que CSV ou JSON.
Pour plus d’informations, consultez Fichiers Parquet.
Options
Consultez les articles de référence Apache Spark suivants pour connaître les options de lecture et d’écriture prises en charge.
Exemple de notebook : Lire et écrire dans des fichiers Parquet
Le notebook suivant montre comment lire et écrire des données dans des fichiers Parquet.