Tutorial: Erfassen von Daten in einem Warehouse
Gilt für:✅ Warehouse in Microsoft Fabric
In diesem Lernprogramm erfahren Sie, wie Sie Daten aus Microsoft Azure Storage in ein Warehouse aufnehmen, um Tabellen zu erstellen.
Anmerkung
Dieses Tutorial ist Teil eines End-to-End-Szenarios. Um dieses Lernprogramm abzuschließen, müssen Sie zuerst folgende Lernprogramme abschließen:
Erfassen von Daten
In dieser Aufgabe erfahren Sie, wie Sie Daten in das Datenlager importieren, um Tabellen zu erstellen.
Stellen Sie sicher, dass der Arbeitsbereich, den Sie im ersten Tutorial erstellt haben, geöffnet ist.
Wählen Sie im Arbeitsbereich der Landing Page + Neues Element aus, um die vollständige Liste der verfügbaren Elementtypen anzuzeigen.
Wählen Sie in der Liste im Abschnitt Daten abrufen den Elementtyp Datenpipeline aus.
Geben Sie im Fenster Neue Pipeline im Feld Name
Load Customer Data
ein.Um die Pipeline bereitzustellen, wählen Sie Erstellen aus. Die Bereitstellung ist abgeschlossen, wenn die Landing Page Erstellen einer Datenpipeline angezeigt wird.
Wählen Sie auf der Landing Page der Datenpipeline Pipelineaktivität aus.
Wählen Sie im Menü im Abschnitt Verschieben und Transformieren Daten kopieren aus.
Wählen Sie im Entwurfsbereich der Pipeline die Aktivität Daten kopieren aus.
Um die Aktivität einzurichten, ersetzen Sie auf der Seite Allgemein im Feld Name den Standardtext durch
CD Load dimension_customer
.Wählen Sie auf der Seite Quelle im Dropdownmenü Verbindung Mehr aus, um alle Datenquellen anzuzeigen, aus denen Sie auswählen können, einschließlich Datenquellen im OneLake-Katalog.
Wählen Sie + Neue aus, um eine neue Datenquelle zu erstellen.
Suchen Sie nach Azure Blobs und wählen Sie es dann aus.
Geben Sie auf der Seite Datenquelle verbinden im Feld Kontoname oder URL
https://fabrictutorialdata.blob.core.windows.net/sampledata/
ein.Beachten Sie, dass das Dropdownmenü Verbindungsname automatisch ausgefüllt wird und dass die Authentifizierungsart auf Anonym festgelegt ist.
Wählen Sie Verbinden.
Um auf der Seite Quelle auf die Parquet-Dateien in der Datenquelle zuzugreifen, nehmen Sie die folgenden Einstellungen vor:
Geben Sie in den Feldern Dateipfad Folgendes ein:
Dateipfad – Container:
sampledata
Dateipfad – Verzeichnis:
WideWorldImportersDW/tables
Dateipfad – Dateiname:
dimension_customer.parquet
Wählen Sie im Dropdownmenü Dateiformat das Format Parquet aus.
Um eine Vorschau der Daten anzuzeigen und zu testen, dass keine Fehler vorhanden sind, wählen Sie Vorschaudatenaus.
Wählen Sie auf der Seite Ziel im Dropdownmenü Verbindung das Warehouse
Wide World Importers
aus.Wählen Sie für die Option Tabelle die Option Tabelle automatisch erstellen aus.
Geben Sie im ersten Feld Tabelle
dbo
ein.Geben Sie im zweiten Feld
dimension_customer
ein.Wählen Sie im Menüband Start Ausführen aus.
Wählen Sie im Dialogfeld Speichern und ausführen? Speichern und ausführen aus, um die Pipeline die Tabelle
dimension_customer
zu laden.Um den Fortschritt der Copy-Aktivität zu überwachen, überprüfen Sie die Pipelineausführungen auf der Seite Ausgabe (warten Sie, bis diese mit dem Status Erfolgreich abgeschlossen sind).