Freigeben über


Lakehouse-Tutorial: Erstellen eines Lakehouse, Erfassen von Beispieldaten und Erstellen eines Berichts

In diesem Tutorial erstellen Sie ein Lakehouse, erfassen Beispieldaten in der Deltatabelle, wenden bei Bedarf Transformation an und erstellen dann Berichte. In diesem Tutorial erhalten Sie Informationen zu Folgendem:

  • Erstellen eines Lakehouse über die Datentechnik-Workload
  • Herunterladen und Erfassen von Beispielkundendaten
  • Hinzufügen von Tabellen zum Semantikmodell
  • Erstellen eines Berichts

Wenn Sie Microsoft Fabric nicht haben, registrieren Sie sich für eine kostenlose Testkapazität.

Voraussetzungen

Erstellen eines Lakehouse

In diesem Abschnitt erstellen Sie ein Lakehouse in der Datentechnik-Umgebung.

  1. Wählen Sie im Power BI im linken Menü Arbeitsbereiche aus.

  2. Geben Sie zum Öffnen Ihres Arbeitsbereichs seinen Namen in das Suchtextfeld oben ein, und wählen Sie ihn in den Suchergebnissen aus.

  3. Wählen Sie im Umschalter unten links Datentechnik aus.

    Screenshot: Position von Umschalter und Datentechnik.

  4. Wählen Sie auf dem Bildschirm Datentechnik die Option Lakehouse aus, um ein Lakehouse zu erstellen.

  5. Geben Sie im Dialogfeld Neues Lakehouse im Feld Namewwilakehouse ein.

    Screenshot: Dialogfeld „Neues Lakehouse“.

  6. Wählen Sie Erstellen aus, um das neue Lakehouse zu erstellen und zu öffnen.

Erfassen von Beispieldaten

In diesem Abschnitt erfassen Sie Beispielkundendaten in das Lakehouse.

Hinweis

Wenn Sie OneDrive nicht konfiguriert haben, registrieren Sie sich für die kostenlose Microsoft 365-Testversion: Kostenlose Testversion – Testen Sie Microsoft 365 für einen Monat.

  1. Laden Sie die Datei dimension_customer.csv aus dem Repository für Fabric-Beispiele herunter.

  2. Auf der Registerkarte Start unter Daten in Ihrem Lakehouse abrufen werden Optionen zum Laden von Daten in das Lakehouse angezeigt. Wählen Sie New Dataflow Gen2 aus.

    Screenshot: Position der Option „New Dataflow Gen2“ zum Laden von Daten in Ihr Lakehouse.

  3. Wählen Sie auf dem neuen Dataflowbildschirm Aus Text-/CSV-Datei importieren aus.

  4. Wählen Sie auf dem Bildschirm Mit Datenquelle verbinden das Optionsfeld Datei hochladen aus. Ziehen Sie die Datei dimension_customer.csv, die Sie in Schritt 1 heruntergeladen haben, und legen Sie sie ab. Wählen Sie nach dem Hochladen der Datei Weiter aus.

    Screenshot: Position der Option „Datei hochladen“ und Ablageort der zuvor heruntergeladenen Datei.

  5. Zeigen Sie auf der Seite Vorschaudateidaten eine Vorschau der Daten an, und wählen Sie Erstellen aus, um fortzufahren und zum Dataflow-Canvas zurückzukehren.

  6. Geben Sie im Bereich Abfrageeinstellungen im Feld Name den Namen dimension_customer ein.

    Hinweis

    Fabric fügt standardmäßig ein Leerzeichen und eine Zahl am Ende des Tabellennamens hinzu. Tabellennamen müssen in Kleinbuchstaben geschrieben sein und dürfen keine Leerzeichen enthalten. Benennen Sie Ihre Tabelle entsprechend um, und entfernen Sie alle Leerzeichen aus dem Tabellennamen.

    Screenshot: Bereich mit den Abfrageeinstellungen und Stellen zum Eingeben des Namens und Auswählen des Datenziels.

  7. In diesem Tutorial haben Sie die Kundendaten einem Lakehouse zugeordnet. Falls Sie andere Datenelemente haben, die Sie dem Lakehouse zuordnen möchten, können Sie diese hinzufügen, indem Sie:

    1. Wählen Sie in den Menüelementen Datenziel hinzufügen und dann Lakehouse aus. Melden Sie sich bei Bedarf auf dem Bildschirm Mit Datenziel verbinden bei Ihrem Konto an, und wählen Sie Weiter aus.

    2. Navigieren Sie in Ihrem Arbeitsbereich zu wwilakehouse.

    3. Falls die Tabelle dimension_customer nicht vorhanden ist, wählen Sie die Einstellung Neue Tabelle aus, und geben Sie den Tabellennamen dimension_customer ein. Wenn die Tabelle bereits vorhanden ist, wählen Sie die Einstellung Vorhandene Tabelle aus, und wählen Sie in der Liste der Tabellen im Objekt-Explorer dimension_customer aus. Wählen Sie Weiter aus.

      Screenshot: Auswählen der Zieltabelle.

    4. Wählen Sie im Bereich Zieleinstellungen auswählen als Updatemethode die Option Ersetzen aus. Wählen Sie Einstellungen speichern aus, um zum Dataflow-Canvas zurückzukehren.

  8. Im Dataflow-Canvas können Sie die Daten ganz einfach entsprechend Ihren Geschäftsanforderungen transformieren. Der Einfachheit halber nehmen wir in diesem Tutorial keine Änderungen vor. Wählen Sie zum Fortfahren unten rechts auf dem Bildschirm Veröffentlichen aus.

    Screenshot: Bereich der Abfrageeinstellungen, der die Schaltfläche „Veröffentlichen“ enthält.

  9. Ein sich drehender Kreis neben dem Namen des Dataflows in der Elementansicht zeigt an, dass die Veröffentlichung ausgeführt wird. Wenn die Veröffentlichung abgeschlossen ist, wählen Sie die ... und dann Eigenschaften aus. Benennen Sie den Dataflow in Lakehouse-Tabelle laden um, und wählen Sie Speichern aus.

  10. die Option Jetzt aktualisieren neben dem Namen des Datenflusses auswählen, um den Dataflow zu aktualisieren. Diese Option führt den Datenfluss aus und verschiebt Daten aus der Quelldatei in die Lakehouse-Tabelle. Während der Ausführung wird in der Elementansicht unter der Spalte Aktualisiert ein sich drehender Kreis angezeigt.

    Screenshot: Position des Symbols „Jetzt aktualisieren“.

  11. Nachdem der Dataflow aktualisiert wurde, wählen Sie Ihr neues Lakehouse in der linken Navigationsleiste aus, um die dimension_customer-Deltatabelle anzuzeigen.

    Screenshot: Navigationsbereich, aus dem das Lakehouse geöffnet wird.

  12. Wählen Sie die Tabelle aus, um eine Vorschau ihrer Daten anzuzeigen. Sie können auch den SQL-Analyseendpunkt des Lakehouse verwenden, um die Daten mit SQL-Anweisungen abzufragen. Wählen Sie oben rechts auf dem Bildschirm im Dropdownmenü Lakehouse die Option SQL-Analyseendpunkt aus.

    Screenshot: Deltatabelle und Position der Option SQL-Analyseendpunkt.

  13. Wählen Sie die Tabelle dimension_customer aus, um eine Vorschau der Daten anzuzeigen, oder wählen Sie Neue SQL-Abfrage aus, um Ihre SQL-Anweisungen zu schreiben.

    Screenshot: Bildschirm des SQL-Analyseendpunkts mit markierter Position zum Auswählen von „Neue SQL-Abfrage“.

  14. Die folgende Beispielabfrage aggregiert die Zeilenanzahl auf der Grundlage der Spalte BuyingGroup der dimension_customer-Tabelle. SQL-Abfragedateien werden automatisch als zukünftige Referenz gespeichert, und Sie können diese Dateien je nach Bedarf umbenennen oder löschen.

    Wählen Sie zum Ausführen des Skripts das Symbol Ausführen oben in der Skriptdatei aus.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Erstellen eines Berichts

In diesem Abschnitt erstellen Sie einen Bericht aus den erfassten Daten.

  1. Zuvor wurden alle Lakehouse-Tabellen und -Ansichten automatisch dem Semantikmodell hinzugefügt. Mit den neuesten Updates müssen Sie für neue Lakehouses Ihre Tabellen dem Semantikmodell manuell hinzufügen. Öffnen Sie Ihr Lakehouse, und wechseln Sie zur Ansicht SQL Analyseendpunkt. Wählen Sie auf der Registerkarte Berichte die Option Standardsemantikmodell verwalten aus, und wählen Sie die Tabellen aus, die Sie dem Semantikmodell hinzufügen möchten. Wählen Sie in diesem Fall die Tabelle dimension_customer aus.

    Screenshot, in dem Sie die Tabellen auswählen können, die dem Semantikmodell hinzugefügt werden sollen.

  2. Um sicherzustellen, dass die Tabellen im Semantikmodell immer synchronisiert sind, wechseln Sie zur Ansicht SQL-Analyseendpunkt, und öffnen Sie den Bereich Einstellungen im Lakehouse. Wählen Sie Standardmäßiges Power BI-Semantikmodell aus, und aktivieren Sie Standardmäßiges Power BI-Semantikmodell synchronisieren. Weitere Informationen finden Sie unter Standardmäßige Power BI-Semantikmodelle.

    Screenshot: Aktivieren der Datensynchronisierung für das standardmäßige Semantikmodell.

  3. Nachdem die Tabelle hinzugefügt wurde, erstellt Fabric ein semantisches Modell mit demselben Namen wie das Lakehouse.

    Screenshot: Standardmäßiges Semantikmodell, das beim Erstellen des neuen Lakehouse erstellt wurde.

  4. Im Bereich des semantischen Modells können Sie alle Tabellen anzeigen. Sie haben die Möglichkeit, Berichte von Grund auf neu zu erstellen, paginierten Berichte zu erstellen oder Power BI auf der Grundlage Ihrer Daten automatisch einen Bericht erstellen zu lassen. Wählen Sie für dieses Tutorial unter Bericht erstellen die Option Automatisch erstellen aus. Im nächsten Tutorial erstellen wir einen Bericht von Grund auf neu.

    Screenshot: Detailseite des Semantikmodells mit markierter Position von „Bericht erstellen“.

  5. Da die Tabelle eine Dimension ist und keine Measures enthalten sind, erstellt Power BI ein Measure für die Zeilenanzahl, aggregiert es für verschiedene Spalten und erstellt verschiedene Diagramme, wie in der folgenden Abbildung dargestellt. Sie können diesen Bericht für die zukünftige Verwendung speichern, indem Sie im oberen Menüband Speichern auswählen. Sie können weitere Änderungen an diesem Bericht vornehmen, um Ihre Anforderungen zu erfüllen, indem Sie weitere Tabellen oder Spalten einschließen oder ausschließen.

    Screenshot: Schnelle Zusammenfassung mit vier verschiedenen Balkendiagrammen.

Nächster Schritt