Udostępnij za pośrednictwem


Odczytywanie plików Parquet przy użyciu usługi Azure Databricks

W tym artykule pokazano, jak odczytywać dane z plików Apache Parquet przy użyciu usługi Azure Databricks.

Co to jest Parquet?

Apache Parquet to format pliku kolumnowego z optymalizacjami, które przyspieszają zapytania. Jest to bardziej wydajny format pliku niż CSV lub JSON.

Aby uzyskać więcej informacji, zobacz Parquet Files.

Opcje

Zapoznaj się z następującymi artykułami referencyjnymi platformy Apache Spark, aby uzyskać informacje na temat obsługiwanych opcji odczytu i zapisu.

Przykład notesu: odczyt i zapis w plikach Parquet

W poniższym notesie pokazano, jak odczytywać i zapisywać dane w plikach Parquet.

Odczytywanie notesu plików Parquet

Pobierz notes