Odczytywanie plików Parquet przy użyciu usługi Azure Databricks
W tym artykule pokazano, jak odczytywać dane z plików Apache Parquet przy użyciu usługi Azure Databricks.
Co to jest Parquet?
Apache Parquet to format pliku kolumnowego z optymalizacjami, które przyspieszają zapytania. Jest to bardziej wydajny format pliku niż CSV lub JSON.
Aby uzyskać więcej informacji, zobacz Parquet Files.
Opcje
Zapoznaj się z następującymi artykułami referencyjnymi platformy Apache Spark, aby uzyskać informacje na temat obsługiwanych opcji odczytu i zapisu.
Przykład notesu: odczyt i zapis w plikach Parquet
W poniższym notesie pokazano, jak odczytywać i zapisywać dane w plikach Parquet.