Freigeben über


Bewährte Methoden zum Erneuten Verwenden von Datenflüssen in Umgebungen und Arbeitsbereichen

In diesem Artikel wird eine Sammlung bewährter Methoden zum effektiven und effizienten Wiederverwenden von Datenflüssen erläutert. Lesen Sie diesen Artikel, um Entwurfsfälle und potenzielle Leistungsprobleme zu vermeiden, während Sie Datenflüsse für die Wiederverwendung entwickeln.

Trennen der Dataflows von Datentransformationen und der Staging-/Extraktionsdataflows

Wenn ein Datenfluss alle Aktionen ausführt, ist es schwierig, seine Tabellen in anderen Datenflüssen oder anderen Zwecken wiederzuverwenden. Die besten Datenflüsse zur Wiederverwendung sind jene, die nur wenige Aktionen ausführen. Das Erstellen von Datenflüssen, die auf eine bestimmte Aufgabe spezialisiert sind, ist eine der besten Möglichkeiten, sie wiederzuverwenden. Wenn Sie über eine Reihe von Dataflows verfügen, die Sie als Staging-Dataflows verwenden, besteht die einzige Aktion darin, Daten unverändert aus dem Quellsystem zu extrahieren. Diese Datenflüsse können in mehreren anderen Datenflüssen wiederverwendet werden.

Wenn Sie datentransformationsdatenflüsse haben, können Sie sie in Datenflüsse aufteilen, die allgemeine Transformationen ausführen. Jeder Datenfluss kann nur wenige Aktionen ausführen. Diese wenigen Aktionen pro Datenfluss stellen sicher, dass die Ausgabe dieses Datenflusses von anderen Datenflüssen wiederverwendbar ist.

Dataflow, der nur wenige Aktionen ausführt

Abbildung mit Daten, die aus einer Datenquelle extrahiert werden, um Dataflows zu erstellen, wobei die Tabellen entweder in Dataverse oder Azure Data Lake Storage gespeichert werden Anschließend werden die Daten in Transformationsdatenflüsse verschoben, in denen die Daten transformiert und in die Data Warehouse-Struktur konvertiert werden. Schließlich werden die Daten in ein Power BI-Semantikmodell geladen.

Verwenden Sie mehrere Arbeitsbereiche

Jeder Arbeitsbereich (oder jede Umgebung) ist nur für Mitglieder dieses Arbeitsbereichs verfügbar. Wenn Sie alle Datenflüsse in einem Arbeitsbereich erstellen, minimieren Sie die Wiederverwendung Ihrer Datenflüsse. Sie können einige generische Arbeitsbereiche für Datenflüsse haben, die unternehmensweite Tabellen verarbeiten. Sie können auch einen Arbeitsbereich für Datenflüsse einrichten, um Tabellen über mehrere Abteilungen hinweg zu verarbeiten. Und Sie können auch einige Arbeitsbereiche für Dataflows haben, die nur in bestimmten Abteilungen verwendet werden können.

Abbildung mit den separaten Arbeitsbereichen.

Festlegen der richtigen Zugriffsebenen für Arbeitsbereiche

Um Zugriff auf Dataflows in anderen Arbeitsbereichen zu gewähren und die Ausgabe eines Dataflows in einem Arbeitsbereich zu verwenden, müssen Sie ihnen lediglich den Zugriff „Ansicht“ im Arbeitsbereich gewähren. Weitere Informationen zu anderen Rollen in einem Power BI-Arbeitsbereich finden Sie unter Rollen in den neuen Arbeitsbereichen.

Screenshot, der zeigt, wie auf den Power BI-Arbeitsbereich zugegriffen werden kann.

Endorsement für den Dataflow in Power BI

In einer Mandantenorganisation können viele Datenflüsse erstellt werden, und es kann für die Benutzer schwierig sein zu wissen, welcher Datenfluss am zuverlässigsten ist. Die Autorenschaft eines Dataflows oder Benutzende, die Bearbeitungszugriff darauf haben, können den Dataflow auf drei Ebenen unterstützen: kein Endorsement, höhergestuft oder zertifiziert.

Diese Bestätigungsebenen helfen Benutzern, zuverlässige Datenflüsse einfacher und schneller zu finden. Der Dataflow mit einer höheren Endorsementstufe wird zuerst angezeigt. Der Power BI-Administrator kann die Befugnis, Datenflüsse auf zertifizierter Ebene zu befürworten, an andere Personen delegieren. Weitere Informationen: Endorsement: Höherstufen und Zertifizieren von Power BI-Inhalten

Screenshot: Power Query-Navigator mit den Endorsementbezeichnungen „Höhergestuft“ und „Zertifiziert“ für bestimmte Dataflows

Trennen von Tabellen in mehreren Datenflüssen

Sie können mehrere Tabellen in einem Datenfluss haben. Ein Grund, warum Sie Tabellen in mehreren Datenflüssen aufteilen könnten, ist das, was Sie früher in diesem Artikel gelernt haben: die Trennung von Datenaufnahme- und Datentransformationsflüssen. Ein weiterer guter Grund für tabellen in mehreren Datenflüssen ist, wenn Sie einen anderen Aktualisierungszeitplan als andere Tabellen verwenden möchten.

In dem in der folgenden Abbildung gezeigten Beispiel muss die Verkaufstabelle alle vier Stunden aktualisiert werden. Die Datumstabelle muss nur einmal pro Tag aktualisiert werden, um den aktuellen Datumsdatensatz auf dem neuesten Stand zu halten. Und eine Produktzuordnungstabelle muss nur einmal pro Woche aktualisiert werden. Wenn Sie alle diese Tabellen in einem Datenfluss haben, haben Sie nur eine Aktualisierungsoption für alle Tabellen. Wenn Sie diese Tabellen jedoch in mehrere Datenflüsse aufteilen, können Sie die Aktualisierung der einzelnen Datenflüsse separat planen.

Abbildung mit Datenflüssen mit unterschiedlichen Zeitplänen für die Aktualisierung.

Geeignete Tabellenkandidaten für Dataflowtabellen

Wenn Sie Lösungen mithilfe von Power Query in den Desktoptools entwickeln, fragen Sie sich möglicherweise selbst. Welche dieser Tabellen sind gute Kandidaten, die in einen Datenfluss verschoben werden sollen? Die besten Tabellen, die in den Datenfluss verschoben werden sollen, sind die Tabellen, die in mehr als einer Lösung oder mehreren Umgebungen oder Diensten verwendet werden müssen. Die in der folgenden Abbildung gezeigte Tabelle „Datum“ muss beispielsweise in zwei separaten Power BI-Dateien verwendet werden. Anstatt diese Tabelle in jeder Datei zu duplizieren, können Sie die Tabelle in einem Datenfluss als Tabelle erstellen und in diesen Power BI-Dateien wiederverwenden.

Abbildung einer freigegebenen Tabelle, die in einem Dataflow verwendet wird