Einführung

Abgeschlossen

Eine der wichtigsten Aufgaben eines Data Analyst in Microsoft Power BI ist das Erstellen eines guten semantischen Modells. Wenn Sie diese Aufgabe erfolgreich erledigen, fällt es Benutzern leichter, Ihre Daten zu verstehen. Dies hat zur Folge, dass sowohl Sie als auch Benutzer einfacher Power BI-Berichte erstellen können.

Die Seiten in diesem Modul sind nur zur Anleitung bestimmt, es werden keine Datendateien bereitgestellt. In den Labs haben Sie die Möglichkeit, mit echten Daten zu arbeiten.

Ein gutes semantisches Modell bietet folgende Vorteile:

  • Das Durchsuchen von Daten erfolgt schneller.

  • Aggregationen können einfacher erstellt werden.

  • Die Berichte sind genauer.

  • Das Schreiben von Berichten nimmt weniger Zeit in Anspruch.

  • Berichte sind in Zukunft einfacher zu verwalten.

Das Formulieren von Regeln für ein gutes semantisches Modell ist schwierig, da sich alle Daten unterscheiden und die Verwendung dieser Daten variiert. Im Allgemeinen ist ein kleineres semantisches Modell besser, da es schneller ausgeführt wird und einfacher zu verwenden ist. Es ist jedoch genauso schwierig zu definieren, was zu einem kleineren semantischen Modell gehört, da es sich dabei um ein heuristisches und subjektives Konzept handelt.

In der Regel umfasst ein kleineres semantisches Modell weniger Tabellen und weniger Spalten in jeder Tabelle, die für die Benutzer*innen sichtbar sind. Wenn Sie alle notwendigen Tabellen aus einer Sales-Datenbank importieren, die Gesamtanzahl der Tabellen jedoch 30 Tabellen beträgt, wird der Benutzer dies nicht als intuitiv ansehen. Wenn diese Tabellen auf fünf Tabellen reduziert werden, ist das semantische Modell für die Benutzer*innen intuitiver. Das Öffnen einer Tabelle mit 100 Spalten kann die Benutzer*innen hingegen überfordern. Wenn nicht benötigte Spalten entfernt werden, um eine besser verwaltbare Anzahl bereitzustellen, erhöht sich die Wahrscheinlichkeit, dass Benutzer*innen alle Spaltennamen lesen. Zusammenfassend lässt sich festhalten, dass Sie beim Entwerfen Ihrer semantischen Modelle auf Einfachheit setzen sollten.

Die folgende Abbildung ist ein Beispiel für ein semantisches Modell. Die Felder enthalten Tabellen mit Daten, wobei jedes Zeilenelement im Feld eine Spalte ist. Die Zeilen, die die Felder verbinden, stellen Beziehungen zwischen den Tabellen dar. Diese Beziehungen können auch in solch einem vereinfachten Modell komplex sein. Das semantische Modell kann schnell unübersichtlich werden, und die Gesamtanzahl der Tabellen im Modell kann sich allmählich erhöhen. Es erfordert konstanten Aufwand, Ihr semantisches Modell einfach, umfassend und präzise zu halten.

Beziehungen zwischen Tabellen werden über Primär- und Fremdschlüssel definiert. Primärschlüssel sind Spalten, die jede eindeutige Datenzeile identifizieren, die nicht NULL ist. Wenn Sie beispielsweise über eine „Customers“-Tabelle verfügen, kann mit einem Index jeder eindeutige Kunde identifiziert werden. Die erste Zeile erhält die ID „1“, die zweite Zeile die ID „2“ und so weiter. Jeder Zeile wird ein eindeutiger Wert zugewiesen, auf den durch diesen einfachen Wert verwiesen werden kann: den Primärschlüssel. Dieser Prozess wird wichtig, wenn Sie auf Zeilen in einer anderen Tabelle verweisen. Dies erfolgt mithilfe von Fremdschlüsseln. Beziehungen zwischen Tabellen werden hergestellt, wenn für verschiedene Tabellen Primär- und Fremdschlüssel gemeinsam verwendet werden.

Mit Power BI können Beziehungen zwischen Tabellen mit unterschiedlichen Datenquellen erstellt werden. Dies ist eine leistungsstarke Funktion, die es Ihnen ermöglicht, eine Tabelle aus Microsoft Excel und eine andere Tabelle aus einer relationalen Datenbank abzurufen. Anschließend erstellen Sie die Beziehung zwischen den beiden Tabellen und behandeln sie wie ein zusammengefügtes semantisches Modell.

Nachdem Sie nun mehr über die Beziehungen zwischen Tabellen erfahren haben, die das Datenschema bilden, können Sie mit dem sogenannten Sternschema eine bestimmte Art von Schemaentwurf untersuchen, die für hohe Leistungsfähigkeit und Benutzerfreundlichkeit optimiert ist.

Sternschemas

Sie können ein Sternschema entwerfen, um Ihre Daten zu vereinfachen. Dies ist zwar nicht die einzige Möglichkeit, Ihre Daten zu vereinfachen, allerdings eine beliebte Methode. Daher sollte jeder Power BI-Datenanalyst diesen Ansatz verstehen. In einem Sternschema ist jede Tabelle in Ihrem semantischen Modell wie im folgenden Visual dargestellt als Dimension oder Faktentabelle definiert.

Faktentabellen enthalten die folgenden beobachtenden Daten oder Ereignisdaten: Verkaufsaufträge, Produktanzahl, Preise, Datumsangaben und Uhrzeiten von Transaktionen sowie Mengen. Faktentabellen können mehrere wiederholte Werte enthalten. Beispielsweise kann ein Produkt für verschiedene Kunden und unterschiedliche Zeitpunkte in mehreren Zeilen mehrmals angezeigt werden. Diese Werte können aggregiert werden, um Visuals zu erstellen. Beispielsweise ist ein Visual der gesamten Verkaufsaufträge eine Aggregation aller Verkaufsaufträge in der Faktentabelle. Bei Faktentabellen werden häufig Spalten angezeigt, die mit Zahlen und Datumsangaben gefüllt sind. Die Zahlen können entweder Maßeinheiten wie Verkaufsbeträge oder Schlüssel wie die Kunden-ID sein. Die Datumsangaben stellen aufgezeichnete Zeitpunkte wie das Bestell- oder Versanddatum dar.

Dimensionstabellen enthalten Details zu den Daten in Faktentabellen: Produkte, Orte, Mitarbeiter und Auftragstypen. Diese Tabellen werden über Schlüsselspalten mit der Faktentabelle verbunden. Dimensionstabellen werden verwendet, um die Daten in Faktentabellen zu filtern und zu gruppieren. Die Faktentabellen hingegen enthalten die messbaren Daten, wie z. B. Umsatz und Ertrag, und jede Zeile repräsentiert eine eindeutige Kombination von Werten aus den Dimensionstabellen. Sie können die Daten für das Visual für die gesamten Verkaufsaufträge so gruppieren, dass diese in Abhängigkeit vom Produkt angezeigt werden, dem die Daten in der Dimensionstabelle zugeordnet sind.

Faktentabellen sind wesentlich größer als Dimensionstabellen, da dort eine Vielzahl von Ereignissen stattfinden, beispielsweise einzelne Verkäufe. Dimensionstabellen sind normalerweise kleiner, da Sie in diesem Fall auf die Anzahl der Elemente beschränkt sind, die Sie filtern und gruppieren können. Zum Beispiel hat ein Jahr nur eine bestimmte Anzahl von Monaten, und die USA umfasst nur eine bestimmte Anzahl von Bundesstaaten.

Angesichts dieser Informationen über Fakten- und Dimensionstabellen fragen Sie sich möglicherweise, wie Sie dieses Visual in Power BI erstellen können.

Die relevanten Daten befinden sich wie im folgenden semantischen Modell dargestellt in den beiden Tabellen „Employee“ und „Sales“. Da die „Sales“-Tabelle die Werte für die Verkaufsaufträge enthält, die aggregiert werden können, wird Sie als Faktentabelle betrachtet. Die „Employee“-Tabelle enthält den spezifischen Mitarbeiternamen, über den die Verkaufsaufträge gefiltert werden, sodass es sich um eine Dimensionstabelle handelt. Die gemeinsame Spalte der beiden Tabellen, bei der es sich um den Primärschlüssel in der „Employee“-Tabelle handelt, ist EmployeeID, sodass Sie basierend auf dieser Spalte eine Beziehung zwischen den beiden Tabellen herstellen können.

Beim Erstellen dieser Beziehung können Sie das Visual wie in der folgenden Abbildung dargestellt entsprechend den Anforderungen erstellen. Es wäre schwieriger, das Visual zu erstellen, wenn die Gemeinsamkeiten der beiden Tabellen zwar offensichtlich sind, Sie diese Beziehung aber nicht hergestellt haben.

Sternschemas und das zugrunde liegende semantische Modell sind die Grundlage organisierter Berichte. Je mehr Zeit Sie sich für die Erstellung dieser Verbindungen und Entwürfe nehmen, desto einfacher ist es später, Berichte zu erstellen und zu verwalten.