Beschreiben der Power BI-Modellgrundlagen
In dieser Lektion werden die Begrifflichkeiten von Power BI-Modellen eingeführt. Es ist wichtig, dass Sie diese Begriffe verstehen, um das entsprechende Modellframework für Ihr Projekt auswählen zu können. In dieser Lektion werden die folgenden Begriffe beschrieben:
- Datenmodell
- Power BI-Dataset
- Analyseabfrage
- Tabellarisches Modell
- Sternschemaentwurf
- Tabellenspeichermodus
- Modellframework
Datenmodell
Ein Power BI-Datenmodell ist eine abfragbare Datenressource, die für Analysen optimiert ist. Berichte können Datenmodelle mithilfe einer von zwei Analysesprachen abfragen: DAX (Data Analysis Expressions, Datenanalyseausdrücke) oder MDX (Multidimensional Expressions, mehrdimensionale Ausdrücke). Power BI verwendet DAX, während paginierte Berichte entweder DAX oder MDX verwenden können. Die „In Excel analysieren“-Features verwenden MDX.
Tipp
Ein Datenmodell wird auch als semantisches Modell beschrieben, insbesondere in Unternehmensszenarien. Gängigerweise wird ein Datenmodell im Kontext einer Datendiskussion und in diesem Modul einfach als Modell bezeichnet.
Power BI-Dataset
Sie entwickeln ein Power BI-Modell in Power BI Desktop, und sobald es in einem Arbeitsbereich im Power BI-Dienst veröffentlicht wurde, wird es dann als Dataset bezeichnet. Ein Dataset ist ein Power BI-Artefakt, das eine Datenquelle für Visualisierungen in Power BI-Berichten und -Dashboards ist.
Hinweis
Nicht alle Datasets stammen aus Modellen, die in Power BI Desktop entwickelt wurden. Einige Datasets stellen Verbindungen mit extern gehosteten Modellen in AAS oder SSAS dar. Andere können Echtzeitdatenstrukturen darstellen, einschließlich Pushdatasets, Streamingdatasets oder Hybriddatasets. Dieses Modul beschäftigt sich nur mit Modellen, die in Power BI Desktop entwickelt wurden.
Analyseabfrage
Power BI-Berichte und -Dashboards müssen ein Dataset abfragen. Wenn Power BI Datasetdaten visualisiert, bereitet es eine Analyseabfrage vor und sendet diese ab. Eine Analyseabfrage erzeugt ein Abfrageergebnis aus einem Modell, das für eine Person einfach zu verstehen ist, insbesondere wenn es visualisiert wird.
Eine Analyseabfrage umfasst drei Phasen, die in der folgenden Reihenfolge ausgeführt werden:
- Filtern
- Gruppieren
- Zusammenfassen
Filtern (manchmal als Slicing (Datenschnitte) bezeichnet) grenzt auf eine Teilmenge der Modelldaten ein. Filterwerte sind im Abfrageergebnis nicht sichtbar. Die meisten Analyseabfragen wenden Filter an, da es gängig ist, nach einem Zeitraum und in der Regel noch anderen Attributen zu filtern. Filtern erfolgt auf unterschiedliche Weise. In einem Power BI-Bericht können Sie Filter auf Berichts-, Seiten- oder Visual-Ebene festlegen. Berichtslayouts enthalten häufig Datenschnittvisuals, um Visuals auf der Berichtsseite zu filtern. Wenn das Modell Sicherheit auf Zeilenebene (RLS) erzwingt, wendet es Filter auf Modelltabellen an, um den Zugriff auf bestimmte Daten einzuschränken. Measures, die Modelldaten zusammenfassen, können ebenfalls Filter anwenden.
Gruppieren (manchmal als Dicing bezeichnet) unterteilt das Abfrageergebnis in Gruppen. Jede Gruppe ist ebenfalls ein Filter, aber im Gegensatz zur Filterphase sind Filterwerte im Abfrageergebnis sichtbar. Beispielsweise filtert die Gruppierung nach Kunden jede Gruppe nach Kunden.
Zusammenfassen erzeugt ein Ergebnis, das aus einem einzelnen Wert besteht. In der Regel fasst ein Berichtsvisual ein numerisches Feld zusammen, indem eine Aggregatfunktion verwendet wird. Aggregatfunktionen sind unter anderem Summe, Anzahl, Minimum, Maximum (sum, count, minimum, maximum) und andere. Sie können einfache Zusammenfassungen erreichen, indem Sie eine Spalte aggregieren, oder eine komplexe Zusammenfassung, indem Sie ein mithilfe einer DAX-Formel ein Measure erstellen.
Betrachten Sie ein Beispiel: Eine Power BI-Berichtsseite enthält einen Datenschnitt, der nach einem einzelnen Jahr filtert. Es gibt außerdem ein Säulendiagrammvisual, das vierteljährliche Umsätze für das gefilterte Jahr anzeigt.
In diesem Beispiel filtert der Datenschnitt das Visual nach dem Kalenderjahr 2021. Das Säulendiagramm gruppiert nach Quartalen (des gefilterten Jahrs). Jede Säule ist eine Gruppe, die einen sichtbaren Filter darstellt. Die Säulenhöhen stellen die zusammengefassten Umsatzwerte für jedes Quartal des gefilterten Jahrs dar.
Tabellarisches Modell
Ein Power BI-Modell ist ein tabellarisches Modell. Ein tabellarisches Modell umfasst eine oder mehrere Tabellen von Spalten. Es kann auch Beziehungen, Hierarchien und Berechnungen enthalten.
Sternschemaentwurf
Um ein optimiertes und bedienfreundliches tabellarisches Modell zu erstellen, empfehlen wir Ihnen, einen Sternschemaentwurf zu erzeugen. Der Sternschemaentwurf ist ein ausgereifter Modellierungsansatz, der weit verbreitet in relationalen Data Warehouse zum Einsatz kommt. Er erfordert, dass Sie Modelltabellen entweder als Dimension oder als Fakt klassifizieren.
Dimensionstabellen beschreiben Geschäftsentitäten, also die Dinge, die Sie modellieren. Entitäten können Produkte, Personen, Orte und Konzepte, einschließlich der Zeit selbst, enthalten. In Faktentabellen werden Beobachtungen oder Ereignisse gespeichert. Dabei kann es sich beispielsweise um Aufträge, Lagerbestände, Wechselkurse oder Temperaturmesswerte handeln. Eine Faktentabelle enthält Dimensionsschlüsselspalten, die sich auf Dimensionstabellen beziehen, und numerische Measurespalten. Eine Faktentabelle bildet die Mitte eines Sterns, und die verknüpften Dimensionstabellen bilden die Spitzen des Sterns.
In einer Analyseabfrage werden Dimensionstabellenspalten gefiltert oder gruppiert. Faktentabellenspalten werden zusammengefasst.
Weitere Informationen finden Sie im Artikel Informationen zum Sternschema und der Wichtigkeit für Power BI.
Tabellenspeichermodus
Jede Power BI-Modelltabelle (außer berechnete Tabellen) verfügt über eine Speichermoduseigenschaft. Die Speichermoduseigenschaft kann entweder Import, DirectQuery oder Dual (doppelt) sein und bestimmt, ob Tabellendaten im Modell gespeichert werden.
- Import: Abfragen rufen Daten ab, die im Modell gespeichert oder zwischengespeichert sind.
- DirectQuery: Abfragen werden an die Datenquelle durchgeleitet.
- Dual (doppelt): Abfragen rufen gespeicherte Daten ab oder werden an die Datenquelle durchgeleitet. Power BI bestimmt den effizientesten Plan, dabei bestrebt, wann immer möglich zwischengespeicherte Daten zu verwenden.
Modellframework
Die Einstellungen des Tabellenspeichermodus bestimmen das Modellframework, das entweder Import, DirectQuery oder zusammengesetzt sein kann. In den folgenden Lektionen dieses Moduls wird jedes dieser Frameworks beschrieben und eine Anleitung zu seiner Verwendung bereitgestellt.
- Ein Importmodell umfasst Tabellen, deren Speichermoduseigenschaft auf Import festgelegt ist.
- Ein DirectQuery-Modell umfasst Tabellen, deren Speichermoduseigenschaft auf DirectQuery festgelegt ist und die zur selben Quellgruppe gehören. Die Quellgruppe wird später in diesem Modul beschrieben.
- Ein zusammengesetztes Modell umfasst mehr als eine Quellgruppe.