Indfødning af data i OneLake, og analysér med Azure Databricks

Artikel
07/26/2024

I denne vejledning skal du:

Opret en pipeline i et arbejdsområde, og indfødning af data i din OneLake i Delta-format.
Læs og rediger en Delta-tabel i OneLake med Azure Databricks.

Forudsætninger

Før du starter, skal du have:

Et arbejdsområde med et Lakehouse-element.
Et Premium Azure Databricks-arbejdsområde. Kun Premium Azure Databricks-arbejdsområder understøtter passthrough af Microsoft Entra-legitimationsoplysninger. Når du opretter din klynge, skal du aktivere passthrough af legitimationsoplysninger til Azure Data Lake Storage i Avancerede indstillinger.
Et eksempeldatasæt.

Indfødning af data, og rediger Delta-tabellen

Gå til dit lakehouse i Power BI-tjeneste, vælg Hent data, og vælg derefter Ny datapipeline.
I prompten Ny pipeline skal du angive et navn til den nye pipeline og derefter vælge Opret.
I denne øvelse skal du vælge NYC Taxi – Grønne eksempeldata som datakilde og derefter vælge Næste.
På eksempelskærmen skal du vælge Næste.
Som datadestination skal du vælge navnet på det lakehouse, du vil bruge til at gemme Data fra OneLake Delta-tabellen. Du kan vælge et eksisterende lakehouse eller oprette et nyt.
Vælg, hvor outputtet skal gemmes. Vælg Tabeller som rodmappe, og angiv "nycsample" som tabelnavn.
På skærmen Gennemse + Gem skal du vælge Start dataoverførsel med det samme og derefter vælge Gem + Kør.
Når jobbet er fuldført, skal du gå til lakehouse og få vist deltatabellen under mappen /Tables.
Højreklik på det oprettede tabelnavn, vælg Egenskaber, og kopiér stien til Azure Blob Filesystem (ABFS).

Åbn din Azure Databricks-notesbog. Læs deltatabellen på OneLake.

olsPath = "abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample" 
df=spark.read.format('delta').option("inferSchema","true").load(olsPath)
df.show(5)

Opdater Delta-tabeldataene ved at ændre en feltværdi.

%sql
update delta.`abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample` set vendorID = 99999 where vendorID = 1;

Transformér data med Apache Spark, og forespørg med SQL

Del via

Indfødning af data i OneLake, og analysér med Azure Databricks

Forudsætninger

Indfødning af data, og rediger Delta-tabellen

Feedback

Yderligere ressourcer

Del via

Indfødning af data i OneLake, og analysér med Azure Databricks

Forudsætninger

Indfødning af data, og rediger Delta-tabellen

Relateret indhold

Feedback

Yderligere ressourcer