Verringern der Kardinalität

Abgeschlossen

Mit dem Begriff „Kardinalität“ wird die Eindeutigkeit der Werte in einer Spalte beschrieben. Kardinalität wird außerdem im Kontext von Beziehungen zwischen zwei Tabellen verwendet, um die Beziehungsrichtung zu beschreiben.

Ermitteln der Kardinalitätsebenen von Spalten

Als Sie zuvor im Power Query-Editor Metadaten analysiert haben, wurden über die Option Spaltenverteilung in der Registerkarte Sicht Statistiken dazu angezeigt, wie viele unterschiedliche und eindeutige Werte die einzelnen Datenspalten enthielten.

  • Anzahl der unterschiedlichen Werte: die Gesamtzahl der verschiedenen Werte, die in einer gegebenen Spalte gefunden wurden

  • Anzahl der eindeutigen Werte: die Gesamtzahl der Werte, die nur einmal in einer gegebenen Spalte vorkommen

Eine Spalte mit vielen sich wiederholenden Werten (niedrige Anzahl eindeutiger Werte) weist beispielsweise eine niedrige Kardinalität auf. Die Kardinalitätsebene einer Spalte mit vielen eindeutigen Werten (hohe Anzahl eindeutiger Werte) fällt hingegen hoch aus.

Eine geringere Kardinalität führt zu einer besseren Leistung. Unter Umständen müssen Sie daher die Anzahl von Spalten mit einer hohen Kardinalität in Ihrem semantischen Modell reduzieren.

Verringern der Beziehungskardinalität

Wenn Sie mehrere Tabellen importieren, werden Sie bei einigen Analysen möglicherweise die Daten aus allen diesen Tabellen verwenden. Beziehungen zwischen diesen Tabellen sind erforderlich, um die Ergebnisse genau zu berechnen und die richtigen Informationen in Ihren Berichten anzuzeigen. Power BI Desktop vereinfacht das Erstellen dieser Beziehungen für Benutzer. Tatsächlich müssen Sie in den meisten Fällen keine weiteren Schritte unternehmen, da das Feature für die automatische Ermittlung diese für Sie ausführt. In bestimmten Situationen werden Sie jedoch Beziehungen erstellen oder Änderungen an einer Beziehung vornehmen müssen. Unabhängig davon ist es wichtig zu verstehen, wie Beziehungen in Power BI Desktop funktionieren und wie sie erstellt und bearbeitet werden.

Beim Erstellen oder Bearbeiten einer Beziehung können Sie zusätzliche Optionen konfigurieren. In Power BI Desktop werden automatisch zusätzliche Optionen auf Grundlage der besten Vermutung konfiguriert. Diese kann aufgrund der Spaltendaten für die einzelnen Beziehungen unterschiedlich ausfallen.

Die Beziehungen können unterschiedliche Kardinalitätsebenen aufweisen. Kardinalität beschreibt die Beziehungsrichtung. Für jede Modellbeziehung muss ein Kardinalitätstyp definiert werden. Folgende Kardinalitätsoptionen sind in Power BI verfügbar:

  • n:1 (*:1) – Diese Beziehung ist die am häufigsten verwendete und somit der Standardtyp. In einer solchen Beziehung können Spalten in einer Tabelle mehrere Instanzen eines Wertes aufweisen, während in der verknüpften Tabelle, die häufig als Nachschlagetabelle bezeichnet wird, nur eine Instanz eines Wertes vorkommt.

  • 1:1 – Bei diesem Beziehungstyp weisen beide Spalten in beiden Tabellen der Beziehung nur eine Instanz eines bestimmten Wertes auf.

  • 1:n (1:*) – Bei diesem Beziehungstyp weist die Spalten in der ersten Tabelle nur eine Instanz eines bestimmten Wertes auf, während die andere über mehr als eine Instanz eines Wertes verfügen kann.

  • n:n – In zusammengesetzten Modellen können Sie n:n-Beziehungen zwischen Tabellen erstellen, wodurch die Anforderungen an eindeutige Werte in Tabellen hinfällig werden. Dasselbe gilt für frühere Problemumgehungen wie das Einführen neuer Tabellen, nur um damit Beziehungen zu erstellen.

Während der Entwicklung erstellen und bearbeiten Sie Beziehungen in Ihrem Modell. Wenn Sie also neue Beziehungen in Ihrem Modell erstellen, sollten Sie immer und unabhängig von der gewählten Kardinalitätsebene sicherstellen, dass die beiden verknüpften Spalten denselben Datentyp aufweisen. Ein Modell kann nicht funktionieren, wenn Sie versuchen, eine Beziehung zwischen zwei Spalten zu erstellen, von denen eine den Datentyp „Text“ und die andere den Datentyp „Integer“ enthält.

Im folgenden Beispiel enthält das Feld ProductID aus den Tabellen „Product“ und „Sales“ Daten vom Typ Ganze Zahl. Die Spalten mit dem Datentyp Integer funktionieren besser als Spalten mit dem Datentyp Text.

Verbessern der Leistung durch Reduzieren der Kardinalitätsebenen

Power BI Desktop bietet verschiedene Methoden, mit denen sich die Datenmengen verringern lassen, die in semantische Modelle geladen werden. Eine solche Methode ist die Zusammenfassung. Indem die in ein Modell geladene Datenmenge reduziert wird, wird die Beziehungskardinalität des Berichts verbessert. Aus diesem Grund ist es wichtig, dass Sie darauf hinarbeiten, die in Ihre Modelle geladene Datenmenge so weit wie möglich zu verkleinern. Dies gilt insbesondere für große Modelle oder Modelle, von denen Sie erwarten, dass sie mit der Zeit stark wachsen.

Die wahrscheinlich effektivste Strategie zum Reduzieren der Modellgröße ist, eine Zusammenfassungstabelle der Datenquelle einzusetzen.  Während eine Detailtabelle jede einzelne Transaktion enthält, weist eine Zusammenfassungstabelle einen Datensatz pro Tag, pro Woche oder pro Monat auf. Dabei kann es sich z. B. um den Durchschnitt aller Transaktionen dieses Tages handeln.

Angenommen, in einer Quellfaktentabelle mit Vertriebsdaten wird jede Auftragsposition in einer Zeile gespeichert. Die Datenmenge ließe sich in dieser Tabelle deutlich mindern, indem alle Vertriebsmetriken zusammengefasst werden. Sie könnten beispielsweise nach Datum, Kunde und Produkt gruppieren. Individuelle Transaktionsdetails werden nicht benötigt.

Bedenken Sie, dass sich eine noch signifikantere Datenreduktion erreichen ließe, indem auf Monatsebene nach Datum gruppiert wird. So wäre es möglich, ein Modell um bis zu 99 % zu schrumpfen. Die tägliche Berichterstellung oder die Berichterstellung zum Stand einzelner Aufträge wäre dann jedoch nicht mehr möglich. Das Zusammenfassen von Faktendaten geht mit Abstrichen bei Detailliertheit Ihrer Daten einher. Ein Nachteil dabei ist, dass Sie u. U. keinen Drilldown mehr für Ihre Daten ausführen können, weil die Details verloren gegangen sind.  Diese Einschränkung kann durch ein gemischtes Modelldesign vorgebeugt werden.

In Power BI Desktop ergibt der gemischte Modus ein zusammengesetztes Modell. Dieser ermöglicht es Ihnen im Wesentlichen, für jede Tabelle einen Speichermodus zu konfigurieren. Die Eigenschaft Speichermodus einer Tabelle kann also auf Importieren oder DirectQuery festgelegt werden.

Die Größe von Modellen lässt sich effektiv verkleinern, indem Sie die Eigenschaft Speichermodus für größere Faktentabellen auf DirectQuery festlegen. Dieser Designansatz kann zusammen mit anderen Methoden für das Zusammenfassen von Daten gut funktionieren. So könnten z. B. zusammengefasste Verkaufsdaten verwendet werden, um Zusammenfassungsberichte effizient zu erstellen. Außerdem kann eine Drillthroughseite erstellt werden, auf der Verkäufe für einen bestimmten (eingegrenzten) Filterkontext detailgenau aufgeführt werden, in dem alle zugehörigen Auftragspositionen angezeigt werden. Die Drillthroughseite würde Visuals enthalten, die auf einer DirectQuery-Tabelle basieren, mit der die Auftragsdaten abgerufen werden (Details zu den Aufträgen).

Weitere Informationen finden Sie unter Verfahren zur Datenreduktion für die Importmodellierung.