Przekształcanie danych za pomocą platformy Spark w usłudze Azure Synapse Analytics
Inżynierowie danych często muszą przekształcać duże ilości danych. Pule platformy Apache Spark w usłudze Azure Synapse Analytics zapewniają rozproszoną platformę przetwarzania, której mogą użyć do osiągnięcia tego celu.
Cele szkolenia
Ten moduł obejmuje następujące zagadnienia:
- Modyfikowanie i zapisywanie ramek danych przy użyciu platformy Apache Spark
- Partycjonowanie plików danych w celu zwiększenia wydajności i skalowalności.
- Przekształcanie danych przy użyciu języka SQL
Wymagania wstępne
Przed rozpoczęciem pracy z tym modułem należy zapoznać się z pulami platformy Apache Spark w usłudze Azure Synapse Analytics. Najpierw rozważ ukończenie modułu Analyze data with Apache Spark in Azure Synapse Analytics (Analizowanie danych za pomocą platformy Apache Spark w usłudze Azure Synapse Analytics ).