Herstellen einer Verbindung mit ADLS und Transformieren der Daten mit Azure Databricks
In diesem Leitfaden werden Sie:
Erstellen Sie eine Delta-Tabelle in Ihrem Azure Data Lake Storage (ADLS) Gen2-Konto mit Azure Databricks.
Erstellen Sie eine OneLake-Verknüpfung zu einer Delta-Tabelle in ADLS.
Verwenden Sie Power BI, um Daten über die ADLS-Verknüpfung zu analysieren.
Voraussetzungen
Bevor Sie beginnen können, benötigen Sie Folgendes:
Ein Arbeitsbereich mit einem Lakehouse-Element
Ein Azure Databricks-Arbeitsbereich
Ein ADLS Gen2-Konto zum Speichern von Delta-Tabellen
Erstellen einer Delta-Tabelle, Erstellen einer Verknüpfung und Analysieren der Daten
Erstellen Sie mithilfe eines Azure Databricks-Notebooks eine Delta-Tabelle in Ihrem ADLS Gen2-Konto.
# Replace the path below to refer to your sample parquet data with this syntax "abfss://<storage name>@<container name>.dfs.core.windows.net/<filepath>" # Read Parquet files from an ADLS account df = spark.read.format('Parquet').load("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/full/dimension_city/") # Write Delta tables to ADLS account df.write.mode("overwrite").format("delta").save("abfss://datasetsv1@olsdemo.dfs.core.windows.net/demo/adb_dim_city_delta/")
Klicken Sie in Ihrem Lakehouse auf die Auslassungspunkte (...) neben den Tabellen, und wählen Sie Neue Verknüpfung aus.
Wählen Sie im Bildschirm Neue Verknüpfung die Kachel Azure Data Lake Storage Gen2 aus.
Geben Sie die Verbindungsdetails für diese Verknüpfung an, und klicken Sie auf Weiter.
Geben Sie die Verknüpfungsdetails an. Geben Sie einen Namen im Feld Verknüpfungsname und die Details für den Unterpfad an, und klicken Sie dann auf Erstellen. Der Unterpfad sollte auf das Verzeichnis verweisen, in dem sich die Delta-Tabelle befindet.
Die Verknüpfung wird als Delta-Tabelle unter Tabellen angezeigt.
Sie können diese Daten jetzt direkt aus einem Notebook abfragen.
df = spark.sql("SELECT * FROM lakehouse1.adls_shortcut_adb_dim_city_delta LIMIT 1000") display(df)
Um auf diese Delta-Tabelle über Power BI zuzugreifen und diese zu analysieren, klicken Sie auf Neues Power BI-Semantikmodell.
Wählen Sie die Verknüpfung aus, und klicken Sie auf Bestätigen.
Wenn die Daten veröffentlicht wurden, wählen Sie Von Grund auf neu starten aus.
In der Berichtserstellungsumgebung werden die Verknüpfungsdaten zusammen mit allen zugehörigen Attributen als Tabelle angezeigt.
Ziehen Sie die Attribute in den Bereich auf der linken Seite, um einen Power BI-Bericht zu erstellen.