Tutorial: Erfassen von Daten in einem Warehouse

Artikel
01/24/2025

Gilt für:✅ Warehouse in Microsoft Fabric

In diesem Lernprogramm erfahren Sie, wie Sie Daten aus Microsoft Azure Storage in ein Warehouse aufnehmen, um Tabellen zu erstellen.

Anmerkung

Dieses Tutorial ist Teil eines End-to-End-Szenarios. Um dieses Lernprogramm abzuschließen, müssen Sie zuerst folgende Lernprogramme abschließen:

Erfassen von Daten

In dieser Aufgabe erfahren Sie, wie Sie Daten in das Datenlager importieren, um Tabellen zu erstellen.

Stellen Sie sicher, dass der Arbeitsbereich, den Sie im ersten Tutorial erstellt haben, geöffnet ist.
Wählen Sie im Arbeitsbereich der Landing Page + Neues Element aus, um die vollständige Liste der verfügbaren Elementtypen anzuzeigen.
Wählen Sie in der Liste im Abschnitt Daten abrufen den Elementtyp Datenpipeline aus.
Geben Sie im Fenster Neue Pipeline im Feld Name Load Customer Dataein.
Um die Pipeline bereitzustellen, wählen Sie Erstellen aus. Die Bereitstellung ist abgeschlossen, wenn die Landing Page Erstellen einer Datenpipeline angezeigt wird.
Wählen Sie auf der Landing Page der Datenpipeline Pipelineaktivität aus.
Wählen Sie im Menü im Abschnitt Verschieben und Transformieren Daten kopieren aus.
Wählen Sie im Entwurfsbereich der Pipeline die Aktivität Daten kopieren aus.
Um die Aktivität einzurichten, ersetzen Sie auf der Seite Allgemein im Feld Name den Standardtext durch CD Load dimension_customer.
Wählen Sie auf der Seite Quelle im Dropdownmenü Verbindung Mehr aus, um alle Datenquellen anzuzeigen, aus denen Sie auswählen können, einschließlich Datenquellen im OneLake-Katalog.
Wählen Sie + Neue aus, um eine neue Datenquelle zu erstellen.
Suchen Sie nach Azure Blobs und wählen Sie es dann aus.
Geben Sie auf der Seite Datenquelle verbinden im Feld Kontoname oder URL https://fabrictutorialdata.blob.core.windows.net/sampledata/ein.
Beachten Sie, dass das Dropdownmenü Verbindungsname automatisch ausgefüllt wird und dass die Authentifizierungsart auf Anonym festgelegt ist.
Wählen Sie Verbinden.
Um auf der Seite Quelle auf die Parquet-Dateien in der Datenquelle zuzugreifen, nehmen Sie die folgenden Einstellungen vor:
1. Geben Sie in den Feldern Dateipfad Folgendes ein:
  1. Dateipfad – Container:sampledata
  2. Dateipfad – Verzeichnis:WideWorldImportersDW/tables
  3. Dateipfad – Dateiname:dimension_customer.parquet
2. Wählen Sie im Dropdownmenü Dateiformat das Format Parquet aus.
Um eine Vorschau der Daten anzuzeigen und zu testen, dass keine Fehler vorhanden sind, wählen Sie Vorschaudatenaus.
Wählen Sie auf der Seite Ziel im Dropdownmenü Verbindung das Warehouse Wide World Importers aus.
Wählen Sie für die Option Tabelle die Option Tabelle automatisch erstellen aus.
Geben Sie im ersten Feld Tabelle dbo ein.
Geben Sie im zweiten Feld dimension_customerein.
Wählen Sie im Menüband Start Ausführen aus.
Wählen Sie im Dialogfeld Speichern und ausführen? Speichern und ausführen aus, um die Pipeline die Tabelle dimension_customer zu laden.
Um den Fortschritt der Copy-Aktivität zu überwachen, überprüfen Sie die Pipelineausführungen auf der Seite Ausgabe (warten Sie, bis diese mit dem Status Erfolgreich abgeschlossen sind).