Del via


Koble til ADLS og transformer dataene med Azure Databricks

I denne veiledningen gjør du følgende:

  • Opprett en Delta-tabell i Azure Data Lake Storage (ADLS) Gen2-kontoen ved hjelp av Azure Databricks.

  • Opprett en OneLake-snarvei til en Delta-tabell i ADLS.

  • Bruk Power BI til å analysere data via ADLS-snarveien.

Forutsetning

Før du begynner, må du ha:

  • Et arbeidsområde med et Lakehouse-element

  • Et Azure Databricks-arbeidsområde

  • En ADLS Gen2-konto for å lagre Delta-tabeller

Opprette en Delta-tabell, opprette en snarvei og analysere dataene

  1. Bruk en Azure Databricks-notatblokk til å opprette en Delta-tabell i ADLS Gen2-kontoen.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Velg ellipsen (...) ved siden av Tabeller i lakehouse, og velg deretter Ny snarvei.

    Skjermbilde som viser plasseringen til ny snarvei i tabeller.

  3. Velg Azure Data Lake Storage Gen2-flisen i skjermbildet Ny snarvei.

    Skjermbilde av flisalternativene i skjermbildet Ny snarvei.

  4. Angi tilkoblingsdetaljene for snarveien, og velg Neste.

    Skjermbilde som viser hvor du skriver inn tilkoblingsinnstillingene for en ny snarvei.

  5. Angi snarveisdetaljene. Angi detaljer for snarveisnavn og underbane , og velg deretter Opprett. Delbanen skal peke til katalogen der Delta-tabellen befinner seg.

    Skjermbilde som viser hvor du skriver inn nye snarveisdetaljer.

  6. Snarveien vises som en Delta-tabell under Tabeller.

    Skjermbilde som viser plasseringen til den nyopprettede ADLS-snarveien.

  7. Du kan nå spørre disse dataene direkte fra en notatblokk.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Hvis du vil få tilgang til og analysere denne Delta-tabellen via Power BI, velger du Ny Semantisk Power BI-modell.

    Skjermbilde som viser hvordan du oppretter en ny semantisk Power BI-modell.

  9. Velg snarveien, og velg deretter Bekreft.

    Skjermbilde som viser nytt semantisk modelloppsett.

  10. Når dataene publiseres, velger du Start fra grunnen av.

    Skjermbilde som viser prosessen for å konfigurere et datasett.

  11. I redigeringsopplevelsen for rapporten vises hurtigdataene som en tabell sammen med alle attributtene.

    Skjermbilde som viser redigeringsopplevelse og tabellattributter.

  12. Hvis du vil bygge en Power BI-rapport, drar du attributtene til ruten på venstre side.

    Skjermbilde som viser data som blir spurt gjennom Power BI-rapporten.