Erstellen und Verwalten einer lokalen Partition (Analysis Services)
Gilt für: SQL Server Analysis Services Azure Analysis Services Fabric/Power BI Premium
Sie können zusätzliche Partitionen für eine Measuregruppe erstellen, um die Verarbeitungsleistung zu verbessern. Durch die Verwendung mehrerer Partitionen können Sie Faktendaten einer entsprechenden Anzahl physischer Datendateien sowohl auf lokalen als auch auf Remoteservern zuordnen. Da Partitionen in Analysis Services unabhängig und parallel verarbeitet werden können, erhalten Sie eine bessere Kontrolle über die Arbeitsauslastungen auf dem Server.
Partitionen können in SQL Server Data Tools während des Modellentwurfs oder nach der Bereitstellung der Lösung mithilfe von SQL Server Management Studio oder XMLA erstellt werden. Es empfiehlt sich, nur einen von beiden Ansätzen zu nutzen. Wenn Sie zwischen tools wechseln, stellen Sie möglicherweise fest, dass Änderungen, die an einer bereitgestellten Datenbank in SQL Server Management Studio vorgenommen werden, überschrieben werden, wenn Sie die Lösung anschließend von SQL Server Data Tools erneut bereitstellen.
Vorbereitung
Überprüfen Sie, ob Sie die Business Intelligence Edition oder Enterprise Edition verwenden. Die Standard Edition bietet keine Unterstützung für mehrere Partitionen. Um die Edition zu überprüfen, klicken Sie mit der rechten Maustaste auf den Serverknoten in SQL Server Management Studio, und wählen Sie Berichte | Allgemein aus. Weitere Informationen zu den verfügbaren Funktionen finden Sie unter Von den SQL Server 2016-Editionen unterstützte Funktionen.
Zu Beginn sollten Sie wissen, dass Partitionen denselben Aggregationsentwurf aufweisen müssen, falls Sie sie später zusammenführen möchten. Partitionen können nur zusammengeführt werden, wenn sie über denselben Aggregationsentwurf und Speichermodus verfügen.
Tipp
Überprüfen Sie die zu partitionierenden Daten in der Datenquellensicht (Data Source View, DSV), um einen Eindruck von Datenbereich und -tiefe zu erhalten. Wenn Sie z. B. nach dem Datum partitionieren, können Sie eine Sortierung nach einer Datumsspalte vornehmen, um die Ober- und Untergrenze der einzelnen Partitionen zu bestimmen.
Auswählen eines Ansatzes
Der wichtigste Faktor beim Erstellen von Partitionen besteht darin, die Daten so zu segmentieren, dass keine doppelten Zeilen vorkommen. Die Daten dürfen jeweils nur in einer Partition enthalten sein, damit keine Zeilen doppelt gezählt werden. Aus diesem Grund wird häufig nach DATE partitioniert, sodass eindeutige Grenzen zwischen den einzelnen Partitionen definiert werden können.
Zum Verteilen der Faktendaten auf mehrere Partitionen können beide Verfahren eingesetzt werden. Folgende Verfahren können zum Segmentieren der Daten verwendet werden.
Verfahren | Empfehlungen |
---|---|
Segmentieren von Faktendaten mithilfe von SQL-Abfragen | Partitionen können mithilfe von SQL-Abfragen definiert werden. Während der Verarbeitung werden die Daten mit der SQL-Abfrage abgerufen. In der WHERE-Klausel der Abfrage ist der Filter angegeben, durch den die Daten für die einzelnen Partitionen segmentiert werden. Die Abfrage wird von Analysis Services generiert, sodass Sie nur noch die WHERE-Klausel definieren müssen, um die Daten ordnungsgemäß zu segmentieren. Der Hauptvorteil dieses Ansatzes besteht in der Leichtigkeit, mit der Daten aus einer einzelnen Quelltabelle partitioniert werden können. Wenn sämtliche Quelldaten aus einer umfangreichen Faktentabelle stammen, können Sie Filterabfragen erstellen, durch die die Daten in diskrete Partitionen aufgeteilt werden, ohne zusätzliche Datenstrukturen in der Datenquellensicht erzeugen zu müssen. Ein Nachteil besteht darin, dass durch die Verwendung von Abfragen die Bindung zwischen Partition und DSV verloren geht. Wenn Sie die DSV später im Analysis Services-Projekt aktualisieren, indem Sie der Faktentabelle z. B. Spalten hinzufügen, müssen Sie die Abfragen für jede Partition manuell bearbeiten, damit die neue Spalte berücksichtigt wird. Für den zweiten Ansatz, der im Folgenden erläutert wird, gilt dieser Nachteil nicht. |
Segmentieren von Faktendaten mithilfe von Tabellen in der DSV | Sie können eine Partition an eine Tabelle, benannte Abfrage oder Sicht in der DSV binden. Als Ausgangsbasis für eine Partition sind die drei Ansätze funktionell gleichwertig. Die gesamte Tabelle, benannte Abfrage oder Sicht stellt sämtliche Daten für eine einzelne Partition bereit. Bei Verwendung einer Tabelle, Sicht oder benannten Abfrage ist die gesamte Logik zur Datenauswahl in der DSV enthalten, die längerfristig einfacher zu verwalten und zu pflegen ist. Ein wichtiger Vorteil dieses Ansatzes besteht darin, dass die Tabellenbindungen erhalten bleiben. Wenn Sie die Quelltabelle später aktualisieren, müssen die Partitionen, die auf der Tabelle basieren, nicht geändert werden. Da alle Tabellen, benannten Abfragen und Sichten außerdem in einem gemeinsamen Arbeitsbereich enthalten sind, lassen sie sich wesentlich einfacher aktualisieren als Partitionsabfragen, die einzeln geöffnet und bearbeitet werden müssen. |
Option 1: Filtern einer Faktentabelle für mehrere Partitionen
Um mehrere Partitionen zu erstellen, ändern Sie zunächst die Source -Eigenschaft der Standardpartition. Standardmäßig wird eine Measuregruppe unter Verwendung einer einzelnen Partition erstellt, die an genau eine Tabelle in der DSV gebunden ist. Da die ursprüngliche Partition nur einen Teil der Faktendaten enthalten soll, müssen Sie sie zunächst bearbeiten, bevor Sie weitere Partitionen hinzufügen können. Anschließend können Sie zusätzliche Partitionen erstellen, um die übrigen Daten darauf zu speichern.
Die Filter sollten so konzipiert sein, dass keine Daten zwischen Partitionen dupliziert werden. Der Filter einer Partition gibt an, welche Daten in der Faktentabelle in der Partition verwendet werden. Es ist wichtig, dass die Filter für alle Partitionen in einem Cube sich gegenseitig ausschließende Datasets aus der Faktentabelle extrahieren. Falls dieselben Faktendaten in mehreren Partitionen enthalten sind, könnten sie doppelt gezählt werden.
Doppelklicken Sie in SQL Server Data Tools in Projektmappen-Explorer auf den Cube, um ihn in Cube Designer zu öffnen, und klicken Sie dann auf die Registerkarte Partitionen.
Erweitern Sie die Measuregruppe, für die Partitionen hinzugefügt werden. Standardmäßig verfügt jede Measuregruppe über eine Partition, die an eine Faktentabelle in der DSV gebunden ist.
Klicken Sie in der Spalte Quelle auf die Schaltfläche Durchsuchen (. .), um das Dialogfeld Partitionsquelle zu öffnen.
Wählen Sie unter Bindungstyp die Option Abfragebindungaus. Die SQL-Abfrage zur Auswahl der Daten wird automatisch eingeblendet.
Fügen Sie in der WHERE-Klausel im unteren Bereich einen Filter hinzu, durch den die Daten für diese Partitionen segmentiert werden.
Beispiele für die Syntax von WHERE-Klauseln sind
WHERE OrderDateKey >= '20060101'
oderWHERE OrderDateKey BETWEEN '20051001' AND '20051201'
. Weitere Beispiele finden Sie unter WHERE (Transact-SQL).Beachten Sie, dass sich die folgenden Filter innerhalb der einzelnen Sätze gegenseitig ausschließen:
Set Wert Satz 1: "SaleYear" = 2012
"SaleYear" = 2013Satz 2: "Continent" = 'NorthAmerica'
"Continent" = 'Europe'
"Continent" = 'SouthAmerica'Satz 3: "Country" = 'USA'
"Country" = 'Mexico'
("Land" <> "USA" UND "Land" <> "Mexiko")Klicken Sie auf Überprüfen , um Syntaxfehler zu suchen, und klicken Sie dann auf OK.
Wiederholen Sie die vorherigen Schritte, um die übrigen Partitionen zu erstellen. Ändern Sie dabei jeweils die WHERE-Klausel, damit der nächste Datenslice ausgewählt wird.
Stellen Sie die Projektmappe bereit, oder lassen Sie die Partition verarbeiten, um die Daten zu laden. Achten Sie darauf, dass alle Partitionen verarbeitet werden.
Durchsuchen Sie den Cube, um sicherzustellen, dass die richtigen Daten zurückgegeben werden.
Nachdem Sie über eine Measuregruppe verfügen, die mehrere Measuregruppen verwendet, können Sie zusätzliche Partitionen in SQL Server Management Studio erstellen. Klicken Sie unterhalb einer Measuregruppe mit der rechten Maustaste auf den Ordner Partitionen, und wählen Sie Neue Partitionen aus, um den Assistenten zu starten.
Hinweis
Anstatt Daten in einer Partition zu filtern, können Sie dieselbe Abfrage zum Erstellen einer benannten Abfrage in der DSV nutzen und dann die benannte Abfrage als Grundlage für die Partition verwenden.
Option 2: Verwenden von Tabellen, Sichten oder benannten Abfragen
Wenn die Fakten in der DSV bereits in einzelne Tabellen unterteilt sind (beispielsweise nach Jahr oder Quartal), können Sie Partitionen auf Grundlage einer einzelnen Tabelle erstellen, wobei jede Partition über eine eigene Datenquellentabelle verfügt. Dies ist im Wesentlichen die Standardmethode zum Partitionieren von Measuregruppen. Bei mehreren Partitionen wird die ursprüngliche Partition jedoch in mehrere Partitionen aufgeteilt, wobei jede neue Partition der Datenquellentabelle zugeordnet wird, die die Daten bereitstellt.
Sichten und benannte Abfragen sind insofern mit Tabellen funktionell gleichwertig, dass alle drei Objekte in der DSV definiert werden und mithilfe der Option Tabellenbindung im Dialogfeld Partitionsquelle an eine Partition gebunden werden. Sie können eine Sicht oder benannte Abfrage erstellen, um das für jede Partition erforderliche Datensegment zu generieren. Weitere Informationen finden Sie unter Definieren benannter Abfragen in einer Datenquellensicht (Analysis Services).
Wichtig
Wenn Sie für Partitionen in einer DSV benannte Abfragen erstellen, die sich gegenseitig ausschließen, sollten Sie sicherstellen, dass die kombinierten Partitionsdaten alle Daten aus einer Measuregruppe einschließen, die Sie in den Cube einbeziehen möchten. Vergewissern Sie sich, dass Sie keine Standardpartition belassen, die auf einer vollständigen Tabelle für eine Measuregruppe basiert. Andernfalls überlappen die Partitionen, die auf einer Abfrage basieren, die auf der vollständigen Tabelle basierende Abfrage.
Erstellen Sie mindestens eine benannte Abfrage, die als Partitionsquelle verwendet werden soll. Weitere Informationen finden Sie unter Definieren benannter Abfragen in einer Datenquellensicht (Analysis Services).
Die benannte Abfrage muss auf der Faktentabelle basieren, die der Measuregruppe zugeordnet ist. Beispiel: Wenn Sie die FactInternetSales-Measuregruppe partitionieren, muss in der FROM-Anweisung der benannten Abfragen in der DSV die FactInternetSales-Tabelle angegeben sein.
Doppelklicken Sie in SQL Server Data Tools in Projektmappen-Explorer auf den Cube, um ihn in Cube Designer zu öffnen, und klicken Sie dann auf die Registerkarte Partitionen.
Erweitern Sie die Measuregruppe, für die Partitionen hinzugefügt werden.
Klicken Sie auf Neue Partition , um den Partitions-Assistenten zu starten. Wenn Sie die benannten Abfragen unter Verwendung der an die Measuregruppe gebundenen Faktentabelle erstellt haben, sollte jede benannte Abfrage, die Sie im vorherigen Schritt erstellt haben, angezeigt werden.
Wählen Sie unter Quellinformationen angeben, eine der in einem vorherigen Schritt erstellten benannten Abfragen aus. Wenn keine benannten Abfragen angezeigt werden, wechseln Sie zurück zur DSV und überprüfen die FROM-Anweisung.
Klicken Sie auf Weiter , um auf den nachfolgenden Seiten die Standardwerte zu akzeptieren.
Geben Sie auf der letzten Seite mit dem Titel Assistenten abschließen einen aussagekräftigen Namen für die Partition an.
Klicken Sie auf Fertig stellen.
Wiederholen Sie die vorherigen Schritte, um die übrigen Partitionen zu erstellen. Wählen Sie jedes Mal eine andere benannte Abfrage aus, um den nächsten Datenslice auszuwählen.
Stellen Sie die Projektmappe bereit, oder lassen Sie die Partition verarbeiten, um die Daten zu laden. Achten Sie darauf, dass alle Partitionen verarbeitet werden.
Durchsuchen Sie den Cube, um sicherzustellen, dass die richtigen Daten zurückgegeben werden.
Nächster Schritt
Wenn Sie sich gegenseitig ausschließende Abfragen für Partitionen erstellen, sollten Sie sicherstellen, dass die kombinierten Partitionsdaten alle Daten einschließen, die Sie in den Cube einbeziehen möchten.
Im letzten Schritt sollte die Standardpartition, die auf der Tabelle selbst basiert war, normalerweise entfernt werden (falls sie noch vorhanden ist). Andernfalls überschneiden sich Abfragen, die auf den Partitionen basieren, mit Abfragen, die auf der gesamten Tabelle basieren.
Weitere Informationen
Partitionen (Analysis Services – Mehrdimensionale Daten)
Remotepartitionen
Zusammenführen von Partitionen in Analysis Services (SSAS – Mehrdimensional)