Lectura de archivos Parquet mediante Azure Databricks
En este artículo se muestra cómo leer datos de archivos de Apache Parquet con Azure Databricks.
¿Qué es Parquet?
Apache Parquet es un formato de archivo en columnas con optimizaciones para acelerar las consultas. Es un formato de archivo mucho más eficaz que el archivo CSV o JSON.
Para obtener más información, vea Archivos de Parquet.
Opciones
Consulte los siguientes artículos de referencia de Apache Spark para ver las opciones de lectura y escritura admitidas.
Ejemplo de cuaderno: lectura y escritura de archivos Parquet
En el cuaderno siguiente se muestra cómo leer y escribir datos en los archivos de Parquet.