Anleitung zur Leistungsoptimierung für den serverlosen SQL-Pool von Azure Synapse Analytics
Gilt für: Azure Synapse Analytics
Dieser Artikel hilft Ihnen, die Leistung für den serverlosen SQL-Pool von Azure Synapse Analytics zu verbessern.
Notiz
Überprüfen Sie die Liste der bekannten Probleme , die derzeit aktiv oder kürzlich in Azure Synapse Analytics behoben sind.
In den nächsten Abschnitten finden Sie Informationen dazu, wie Sie eine optimale Leistung erzielen und Fehler verhindern können, die sich auf Ressourceneinschränkungen in Ihren Serverlosen SQL-Pools von Azure Synapse Analytics beziehen.
Bewährte Methoden und Anleitungen zur Problembehandlung
Die Informationen und Strategien in den folgenden Artikeln können Ihnen helfen, die beste Leistung aus Ihrem serverlosen SQL-Pool zu erzielen. Es wird empfohlen, diese Artikel zu verwenden, um Anwendungsfälle zu überprüfen und häufige Probleme zu beheben.
- Best Practices für serverlose SQL-Pools in Azure Synapse Analytics
- Problembehandlung für einen serverlosen SQL-Pool in Azure Synapse Analytics
Grundlegendes zur Skalierung auf serverlosen SQL-Pool
Serverlose SQL-Pools erfordern nicht, dass Sie manuell die richtige Größe auswählen. Das System passt die Größe automatisch basierend auf Ihren Abfrageanforderungen an und verwaltet dadurch die Infrastruktur und wählt die richtige Größe für Ihre Lösung aus.
Anleitung zur Leistungsoptimierung für Delta Lake-Dateien
Weitere Informationen zur Leistungsoptimierung für Delta Lake-Dateien finden Sie in den folgenden Ressourcen:
- Delta Lake-Dokumentationsseite
- Was ist Delta Lake?
- Abfragen von Delta Lake-Dateien mithilfe eines serverlosen SQL-Pools in Azure Synapse Analytics
Leitfaden zur Leistungsoptimierung für CSV-Dateien
Wenn Sie CSV-Dateien in einem serverlosen SQL-Pool abfragen, ist die wichtigste Aufgabe, um sicherzustellen, dass hohe Leistung Statistiken zu den externen Tabellen erstellt. Statistiken werden zwar automatisch für Parkett- und CSV-Dateien erstellt und mithilfe der OPENQUERY()
Verwendung darauf zugegriffen, aber das Lesen der CSV-Dateien mithilfe externer Tabellen erfordert, dass Sie manuell Statistiken erstellen.
Ausführlichere Informationen zur Rolle von Statistiken beim Abfragen von CSV-Dateien in serverlosen SQL-Pools finden Sie in den folgenden Artikeln:
- Abfragen von CSV-Dateien
- Statistiken im serverlosen SQL-Pool
- Manuelles Erstellen von Statistiken für CSV-Dateien
- Abfragetimeout abgelaufen
Empfehlungen für die Verwendung von Power BI und anderen Berichterstellungstools
Wir empfehlen die folgenden bewährten Methoden, wenn Sie Power BI und andere Berichterstellungstools verwenden:
- Überprüfen Sie stets den Standort Ihres Mandanten.
- Richten Sie einen Cache ein, um die Benutzerfreundlichkeit zu erhöhen.
- Geben Sie nach Möglichkeit nicht mehrere Millionen Datensätze an ein Dashboard zurück.
- Verwenden Sie geplante Aktualisierungen, um parallele Abfrageausführungen zu vermeiden, die SQL Serverless-Poolressourcen entwässern.
- Verwenden Sie Spark, um allgemeine analysebasierte Abfragen vorab zu aggregieren. Dieser Ansatz zum Schreiben von Einmal-/Lesevorgängen kann schwere Abfragen vermeiden, die kontinuierlich ausgeführt werden.
- Für Verknüpfungen zwischen verschiedenen Datenspeichern: Verwenden Sie Filter, um Große Datenvolumes zu vermeiden, die in Ihre Azure-Infrastruktur verschoben wurden.
- Verwenden Sie
Latin1_General_100_BIN2_UTF8
die Sortierung für Zeichendatentypen. Durch diese Sortierung wird verhindert, dass alle Daten vom Speicher in den serverlosen SQL-Pool übertragen werden, indem Filter gedrückt werden, wenn Tools aus dem Speicher gelesen werden. - Verwenden Sie die optimale Größe, wenn Sie Daten
char
umwandeln oder in odervarchar
während der Ausführung einer Abfrage konvertieren. Wenn möglich, vermeiden Sie die Verwendung vonVARCHAR(MAX)
. - Die automatische Ableitung konvertiert Datentypen in ein Format, das möglicherweise nicht optimal ist. Verwenden Sie die
WITH
-Klausel zur Optimierung von Datentypen. - Die Azure Synapse SQL Serverless-Poolressourcen weisen Beschränkungen auf. Das gleichzeitige Ausführen von Abfragen verbraucht Ressourcen. Es ist üblich, dass Power BI-Dashboards (PBI) ressourcenlimits erreichen, wenn mehrere Aktualisierungen parallel auftreten. Geplante Aktualisierungen und Auslastungstests können dazu beitragen, dieses Problem zu vermeiden. Außerdem kann die Verwendung mehrerer Azure Synapse-Arbeitsbereiche größere Parallelitätsanforderungen erfüllen.
- Sie können die Abfrage
sys.columns
ausführen oder verwendensp_describe_first_result_set
undselect top 0 from <view>
die Datentypen überprüfen, nachdem Sie eine Ansicht erstellt haben. Dieser Ansatz ist schneller und kostengünstiger als die VerwendungSELECT * FROM...
. - Verwenden Sie den Statement Generator , um automatisch optimale Spaltenformate für Ihre Abfrage zu erstellen.
- Verwenden Sie die
OPENJSON
Funktion, um geschachtelte JSON-Daten als Spalten verfügbar zu machen. Wenn Sie aber auch denAS JSON
Befehl verwenden, muss der Spaltentyp seinNVARCHAR(MAX)
. Dieser Ansatz ist nicht ideal für die Leistung. Die beste Option ist die Verwendung derWITH
Klausel, um verschachtelte Arrays als Spalten darzustellen. - Der Partitionsschlüssel des Cosmos DB-Transaktionsspeichers wird nicht im Analytischen Speicher verwendet. In Azure Synapse Link können Sie Ihre Transaktionsdaten jetzt modellieren, um die Datenerfassung und Punktlesevorgänge zu optimieren.
Zusätzliche Anleitungen und bewährte Methoden
Kategorie | Empfohlene Aktionen oder Dokumentation |
---|---|
Durchsuchen von Daten | Azure Storage Speichern von Abfrageergebnissen in Azure-Speicher Logisches Data Warehouse |
OPENROWSET und externe Tabellen | OPENROWSET-Funktion Externe Tabellen Gespeicherte Prozeduren Ansichten Datentransformationen |
Verfügbare T-SQL-Features in serverlosen SQL-Pools | T-SQL-Features in Azure Synapse-Pools |
Informationen zum Haftungsausschluss von Drittanbietern
Die in diesem Artikel genannten Drittanbieterprodukte stammen von Herstellern, die von Microsoft unabhängig sind. Microsoft gewährt keine implizite oder sonstige Garantie in Bezug auf die Leistung oder Zuverlässigkeit dieser Produkte.