Delen via


Verbinding maken met ADLS en de gegevens transformeren met Azure Databricks

In deze handleiding gaat u het volgende doen:

  • Maak een Delta-tabel in uw Azure Data Lake Storage Gen2-account (ADLS) met behulp van Azure Databricks.

  • Maak een OneLake-snelkoppeling naar een Delta-tabel in ADLS.

  • Gebruik Power BI om gegevens te analyseren via de ADLS-snelkoppeling.

Vereisten

Voordat u begint, moet u het volgende hebben:

  • Een werkruimte met een Lakehouse-item

  • Een Azure Databricks-werkruimte

  • Een ADLS Gen2-account voor het opslaan van Delta-tabellen

Een Delta-tabel maken, een snelkoppeling maken en de gegevens analyseren

  1. Maak met behulp van een Azure Databricks-notebook een Delta-tabel in uw ADLS Gen2-account.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Selecteer in uw lakehouse het beletselteken (...) naast Tabellen en selecteer vervolgens Nieuwe snelkoppeling.

    Schermopname van de locatie van nieuwe snelkoppeling in tabellen.

  3. Selecteer in het scherm Nieuwe snelkoppeling de tegel Azure Data Lake Storage Gen2 .

    Schermopname van de tegelopties in het scherm Nieuwe snelkoppeling.

  4. Geef de verbindingsgegevens voor de snelkoppeling op en selecteer Volgende.

    Schermopname die laat zien waar de verbindingsinstellingen voor een nieuwe snelkoppeling moeten worden ingevoerd.

  5. Geef de details van de snelkoppeling op. Geef de details van de snelkoppelingsnaam en het subpad op en selecteer Vervolgens Maken. Het subpad moet verwijzen naar de map waarin de Delta-tabel zich bevindt.

    Schermopname die laat zien waar u nieuwe snelkoppelingsgegevens kunt invoeren.

  6. De snelkoppeling wordt weergegeven als een Delta-tabel onder Tabellen.

    Schermopname van de locatie van de zojuist gemaakte ADLS-snelkoppeling.

  7. U kunt deze gegevens nu rechtstreeks vanuit een notebook opvragen.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Als u deze Delta-tabel wilt openen en analyseren via Power BI, selecteert u nieuw semantisch Power BI-model.

    Schermopname die laat zien hoe u een nieuw semantisch Power BI-model maakt.

  9. Selecteer de snelkoppeling en selecteer vervolgens Bevestigen.

    Schermopname van het instellen van een nieuw semantisch model.

  10. Wanneer de gegevens worden gepubliceerd, selecteert u Helemaal opnieuw beginnen.

    Schermopname van het proces voor het instellen van een gegevensset.

  11. In de ontwerpervaring voor rapporten worden de snelkoppelingsgegevens weergegeven als een tabel, samen met alle bijbehorende kenmerken.

    Schermopname van ontwerpervaring en tabelkenmerken.

  12. Als u een Power BI-rapport wilt maken, sleept u de kenmerken naar het deelvenster aan de linkerkant.

    Schermopname van gegevens die worden opgevraagd via een Power BI-rapport.