Freigeben über


Herstellen einer Verbindung mit ADLS und Transformieren der Daten mit Azure Databricks

In diesem Leitfaden werden Sie:

  • Erstellen Sie eine Delta-Tabelle in Ihrem Azure Data Lake Storage (ADLS) Gen2-Konto mit Azure Databricks.

  • Erstellen Sie eine OneLake-Verknüpfung zu einer Delta-Tabelle in ADLS.

  • Verwenden Sie Power BI, um Daten über die ADLS-Verknüpfung zu analysieren.

Voraussetzungen

Bevor Sie beginnen können, benötigen Sie Folgendes:

  • Ein Arbeitsbereich mit einem Lakehouse-Element

  • Ein Azure Databricks-Arbeitsbereich

  • Ein ADLS Gen2-Konto zum Speichern von Delta-Tabellen

Erstellen einer Delta-Tabelle, Erstellen einer Verknüpfung und Analysieren der Daten

  1. Erstellen Sie mithilfe eines Azure Databricks-Notebooks eine Delta-Tabelle in Ihrem ADLS Gen2-Konto.

     # Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>"
    
     # Read Parquet files from an ADLS account
     df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/")
    
     # Write Delta tables to ADLS account
     df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
    
  2. Klicken Sie in Ihrem Lakehouse auf die Auslassungspunkte (...) neben den Tabellen, und wählen Sie Neue Verknüpfung aus.

    Screenshot: Position von „Neue Verknüpfung” in Tabellen

  3. Wählen Sie im Bildschirm Neue Verknüpfung die Kachel Azure Data Lake Storage Gen2 aus.

    Screenshot der Kacheloptionen auf dem Bildschirm Neue Verknüpfung.

  4. Geben Sie die Verbindungsdetails für diese Verknüpfung an, und klicken Sie auf Weiter.

    Screenshot, der zeigt, wo Sie die Verbindungseinstellungen für eine neue Verknüpfung eingeben können.

  5. Geben Sie die Verknüpfungsdetails an. Geben Sie einen Namen im Feld Verknüpfungsname und die Details für den Unterpfad an, und klicken Sie dann auf Erstellen. Der Unterpfad sollte auf das Verzeichnis verweisen, in dem sich die Delta-Tabelle befindet.

    Screenshot: Eingabe der Details für die neue Verknüpfung

  6. Die Verknüpfung wird als Delta-Tabelle unter Tabellen angezeigt.

    Screenshot: Position der neu erstellten ADLS-Verknüpfung

  7. Sie können diese Daten jetzt direkt aus einem Notebook abfragen.

    df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000")
    display(df)
    
  8. Um auf diese Delta-Tabelle über Power BI zuzugreifen und diese zu analysieren, klicken Sie auf Neues Power BI-Semantikmodell.

    Screenshot: Erstellen eines neuen semantischen Modells von Power BI.

  9. Wählen Sie die Verknüpfung aus, und klicken Sie auf Bestätigen.

    Screenshot des neuen Semantikmodell-Setups.

  10. Wenn die Daten veröffentlicht wurden, wählen Sie Von Grund auf neu starten aus.

    Screenshot: Einrichten eines Datasets.

  11. In der Berichtserstellungsumgebung werden die Verknüpfungsdaten zusammen mit allen zugehörigen Attributen als Tabelle angezeigt.

    Screenshot: Erstellungsumgebung und Tabellenattribute

  12. Ziehen Sie die Attribute in den Bereich auf der linken Seite, um einen Power BI-Bericht zu erstellen.

    Screenshot: Abfrage der Daten über einen Power BI-Bericht