Ler arquivos do Parquet usando o Azure Databricks
Este artigo mostra como ler dados de arquivos Apache Parquet usando o Azure Databricks.
Qual é Parquet?
Apache Parquet é um formato de arquivo colunar com otimizações que aceleram as consultas. É um formato de arquivo mais eficiente do que CSV ou JSON.
Para obter mais informações, consulte Arquivos do Parquet.
Opções
Consulte os seguintes artigos de referência do Apache Spark para obter as opções de leitura e gravação suportadas.
Exemplo de bloco de anotações: Ler e gravar em arquivos do Parquet
O bloco de anotações a seguir mostra como ler e gravar dados em arquivos do Parquet.