Eseguire operazioni di ingegneria dei dati con pool di Apache Spark di Azure Synapse
Apache Spark è una soluzione di elaborazione distribuita altamente scalabile per l'analisi e la trasformazione di Big Data. È possibile sfruttarne la potenza in Azure Synapse Analytics usando pool di Spark.
Prerequisiti
Per iniziare questo percorso di apprendimento è consigliabile acquisire familiarità con Azure Synapse Analytics. Valutare la possibilità di completare prima il modulo Introduzione ad Azure Synapse Analytics.
Codice obiettivo
Si vuole richiedere un codice obiettivo?
Moduli in questo percorso di apprendimento
Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Informazioni su come usare Spark in Azure Synapse Analytics per analizzare e visualizzare i dati in un data lake.
Gli ingegneri dei dati devono in genere trasformare grandi volumi di dati. I pool di Apache Spark in Azure Synapse Analytics forniscono una piattaforma di elaborazione distribuita che è possibile usare allo scopo.
Delta Lake è un'area di archiviazione relazionale open source per Spark che è possibile usare per implementare un'architettura data lakehouse in Azure Synapse Analytics.