Bewährte Methoden für die Wiederverwendung von Dataflows in Umgebungen und Arbeitsbereichen
In diesem Artikel wird eine Sammlung bewährter Methoden für die effektive und effiziente Wiederverwendung von Dataflows erläutert. Lesen Sie diesen Artikel, um Risiken beim Entwurf und potenzielle Leistungsprobleme zu vermeiden, während Sie Dataflows für die Wiederverwendung entwickeln.
Datentransformations-Dataflows von Staging-/Extraktions-Dataflows trennen
Wenn ein Dataflow alle Aktionen ausführt, ist es schwierig, seine Tabellen in anderen Dataflows oder für andere Zwecke wiederzuverwenden. Die Dataflows, die sich am besten wiederverwenden lassen, sind Dataflows, die nur wenige Aktionen ausführen. Das Erstellen von Dataflows, die auf eine bestimmte Aufgabe spezialisiert sind, ist eine der besten Möglichkeiten, sie wiederzuverwenden. Wenn Sie über eine Reihe von Dataflows verfügen, die Sie als Staging-Dataflows verwenden, besteht die einzige Aktion darin, Daten unverändert aus dem Quellsystem zu extrahieren. Diese Dataflows können in mehreren anderen Dataflows wiederverwendet werden.
Wenn Sie Datentransformations-Dataflows haben, können Sie diese in Dataflows aufteilen, die allgemeine Transformationen durchführen. Jeder Dataflow kann nur wenige Aktionen ausführen. Diese wenigen Aktionen pro Dataflow stellen sicher, dass die Ausgabe dieses Dataflows von anderen Dataflows wiederverwendbar ist.
Bild mit Daten, die aus einer Datenquelle extrahiert werden, um Dataflows bereitzustellen, wobei die Tabellen entweder im Dataverse- oder Azure Data Lake Storage gespeichert werden Anschließend werden die Daten in Transformations-Dataflows verschoben, in denen die Daten transformiert und in die Data Warehouse-Struktur konvertiert werden. Schließlich werden die Daten in ein semantisches Modell von Power BI geladen.
Mehrerer Arbeitsbereiche verwenden
Jeder Arbeitsbereich (oder jede Umgebung) ist nur für Mitglieder dieses Arbeitsbereichs verfügbar. Wenn Sie alle Dataflows in einem Arbeitsbereich erstellen, minimieren Sie die Wiederverwendung Ihrer Dataflows. Sie können einige generische Arbeitsbereiche für Dataflows haben, die unternehmensweite Tabellen verarbeiten. Sie können auch über einen Arbeitsbereich für Dataflows verfügen, um Tabellen in mehreren Abteilungen zu verarbeiten. Und Sie können auch einige Arbeitsbereiche für Dataflows besitzen, die nur in bestimmten Abteilungen verwendet werden können.
Die richtige Zugriffsebene für Arbeitsbereiche festlegen
Um Zugriff auf Dataflows in anderen Arbeitsbereichen zu gewähren und die Ausgabe eines Dataflows in einem Arbeitsbereich zu verwenden, müssen Sie ihnen lediglich den Zugriff „Ansicht“ im Arbeitsbereich gewähren. Weitere Informationen zu anderen Rollen in einem Power BI-Arbeitsbereich finden Sie unter Rollen in den neuen Arbeitsbereichen.
Bestätigung im Dataflow in Power BI
In einer Mandantenorganisation können viele Dataflows erstellt werden, und für die Benutzer kann es schwierig sein, zu wissen, welcher Dataflow am zuverlässigsten ist. Ersteller eines Dataflows oder Benutzer, die Bearbeitungszugriff darauf haben, können den Dataflow auf drei Ebenen unterstützen: keine Bestätigung, höhergestuft oder zertifiziert.
Diese Bestätigungsebenen helfen Benutzern, zuverlässige Dataflows einfacher und schneller zu finden. Der Dataflow mit einer höheren Bestätigungsstufe wird zuerst angezeigt. Der Power BI-Administrator kann die Möglichkeit, Dataflows auf der zertifizierten Ebene zu unterstützen, an andere Personen delegieren. Weitere Informationen: Bestätigung – Höherstufung und Zertifizierung von Power BI-Inhalten
Tabellen in mehrere Dataflows aufteilen
Sie können mehrere Tabellen in einem Dataflow haben. Einer der Gründe, warum Sie Tabellen möglicherweise in mehrere Dataflows aufteilen, hängt damit zusammen, was Sie weiter oben in diesem Artikel über die Trennung der Dataflows der Datenerfassung und der Datentransformation gelernt haben. Ein weiterer guter Grund, Tabellen in mehreren Dataflows zu haben, besteht darin, dass Sie einen anderen Aktualisierungszeitplan als andere Tabellen wünschen.
In dem in der folgenden Abbildung gezeigten Beispiel muss die Verkaufstabelle alle vier Stunden aktualisiert werden. Die Datumstabelle muss nur einmal pro Tag aktualisiert werden, um den aktuellen Datumsdatensatz zu aktualisieren. Und eine Produktzuordnungstabelle muss nur einmal pro Woche aktualisiert werden. Wenn Sie alle diese Tabellen in einem Dataflow haben, haben Sie nur eine Aktualisierungsoption für alle Tabellen. Wenn Sie diese Tabellen jedoch in mehrere Dataflows aufteilen, können Sie die Aktualisierung der einzelnen Dataflows separat planen.
Geeignete Tabellenkandidaten für Dataflow-Tabellen
Wenn Sie Lösungen mithilfe von Power Query in den Desktoptools entwickeln, fragen Sie sich möglicherweise selbst: Welche dieser Tabellen sind geeignete Kandidaten, die in einen Dataflow verschoben werden sollen? Die besten Tabellen, die in den Dataflow verschoben werden sollen, sind die Tabellen, die in mehr als einer Lösung oder mehreren Umgebungen oder Diensten verwendet werden müssen. Die in der folgenden Abbildung gezeigte Tabelle „Datum“ muss beispielsweise in zwei separaten Power BI-Dateien verwendet werden. Anstatt diese Tabelle in jeder Datei zu duplizieren, können Sie die Tabelle in einem Dataflow als Tabelle erstellen und in diesen Power BI-Dateien wiederverwenden.