Dela via


Ansluta till ADLS och transformera data med Azure Databricks

I den här guiden kommer du att:

  • Skapa en Delta-tabell i ditt Azure Data Lake Storage (ADLS) Gen2-konto med Azure Databricks.

  • Skapa en OneLake-genväg till en Delta-tabell i ADLS.

  • Använd Power BI för att analysera data via ADLS-genvägen.

Förutsättningar

Innan du börjar måste du ha:

  • En arbetsyta med ett Lakehouse-objekt

  • En Azure Databricks-arbetsyta

  • Ett ADLS Gen2-konto för att lagra Delta-tabeller

Skapa en Delta-tabell, skapa en genväg och analysera data

  1. Skapa en Delta-tabell i ditt ADLS Gen2-konto med hjälp av en Azure Databricks-notebook-fil.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. I lakehouse väljer du ellipserna (...) bredvid Tabeller och väljer sedan Ny genväg.

    Skärmbild som visar platsen för ny genväg i tabeller.

  3. På skärmen Ny genväg väljer du panelen Azure Data Lake Storage Gen2.

    Skärmbild av panelalternativen på skärmen Ny genväg.

  4. Ange anslutningsinformationen för genvägen och välj Nästa.

    Skärmbild som visar var du anger anslutningsinställningarna för en ny genväg.

  5. Ange genvägsinformationen. Ange information om genvägsnamn och undersökväg och välj sedan Skapa. Undersökvägen ska peka på katalogen där Delta-tabellen finns.

    Skärmbild som visar var du anger ny genvägsinformation.

  6. Genvägen visas som en Delta-tabell under Tabeller.

    Skärmbild som visar platsen för den nyligen skapade ADLS-genvägen.

  7. Du kan nu köra frågor mot dessa data direkt från en notebook-fil.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Om du vill komma åt och analysera deltatabellen via Power BI väljer du Ny Power BI-semantisk modell.

    Skärmbild som visar hur du skapar en ny Power BI-semantisk modell.

  9. Välj genvägen och välj sedan Bekräfta.

    Skärmbild som visar ny konfiguration av semantisk modell.

  10. När data publiceras väljer du Starta från början.

    Skärmbild som visar processen för att konfigurera en datauppsättning.

  11. I rapportens redigeringsmiljö visas genvägsdata som en tabell tillsammans med alla dess attribut.

    Skärmbild som visar redigeringsupplevelse och tabellattribut.

  12. Om du vill skapa en Power BI-rapport drar du attributen till fönstret till vänster.

    Skärmbild som visar data som efterfrågas via Power BI-rapporten.