Grundlegendes zu Serverlosen SQL-Poolfunktionen und Anwendungsfällen in Azure Synapse
Azure Synapse Analytics ist ein integrierter Analysedienst, der eine breite Palette häufig verwendeter Technologien für die Verarbeitung und Analyse von Daten im großen Maßstab vereint. Eine der am häufigsten verwendeten Technologien in Datenlösungen ist SQL – eine Branchenstandardsprache zum Abfragen und Bearbeiten von Daten.
Serverlose SQL-Pools in Azure Synapse Analytics
Azure Synapse SQL ist ein verteiltes Abfragesystem in Azure Synapse Analytics, das zwei Arten von Laufzeitumgebungen bietet:
- Serverless SQL-Pool: Sql-Abfrageverarbeitung bei Bedarf, die hauptsächlich zum Arbeiten mit Daten in einem Data Lake verwendet wird.
- dedizierten SQL-Pool: relationale Datenbankinstanzen im Unternehmensmaßstab, die zum Hosten von Data Warehouses verwendet werden, in denen Daten in relationalen Tabellen gespeichert werden.
In diesem Modul konzentrieren wir uns auf den serverlosen SQL-Pool, der einen Pay-per-Query-Endpunkt zum Abfragen der Daten in Ihrem Datensee bereitstellt. Zu den Vorteilen der Verwendung von serverlosen SQL-Pools gehören:
- Eine vertraute Transact-SQL Syntax zum Abfragen von Daten, ohne dass Daten in einen speziellen Speicher kopiert oder geladen werden müssen.
- Integrierte Konnektivität aus einer vielzahl von Business Intelligence- und Ad-hoc-Abfragetools, einschließlich der beliebtesten Treiber.
- Verteilte Abfrageverarbeitung, die für umfangreiche Daten und Rechenfunktionen erstellt wird, was zu einer schnellen Abfrageleistung führt.
- Integrierte Fehlertoleranz bei der Abfrageausführung, was zu hohen Zuverlässigkeits- und Erfolgsraten auch für lange ausgeführte Abfragen mit großen Datasets führt.
- Keine Infrastruktur zum Einrichten oder Verwalten von Clustern. Ein integrierter Endpunkt für diesen Dienst wird in jedem Azure Synapse-Arbeitsbereich bereitgestellt, sodass Sie mit der Abfrage von Daten beginnen können, sobald der Arbeitsbereich erstellt wird.
- Keine Gebühr für reservierte Ressourcen, Sie werden nur für die von Ihnen ausgeführten Abfragen verarbeiteten Daten belastet.
Verwendung serverloser SQL-Pools
Der serverlose SQL-Pool ist auf die Abfrage der Daten im Datensee zugeschnitten, sodass zusätzlich zur Beseitigung der Verwaltungslast keine Sorgen mehr über die Erfassung der Daten in das System erforderlich sind. Sie verweisen einfach auf die Daten, die sich bereits im See befindet, und führen sie aus.
Synapse SQL serverless resource model is great for unplanned or "bursty" workloads that can be processed using the always-on serverless SQL endpoint in your Azure Synapse Analytics workspace. Die Verwendung des serverlosen Pools hilft, wenn Sie genaue Kosten für jede Abfrage kennen müssen, die zur Überwachung und Attributkosten ausgeführt wird.
Hinweis
Der Serverlose SQL-Pool ist ein Analysesystem und wird für OLTP-Workloads wie Datenbanken, die von Anwendungen zum Speichern von Transaktionsdaten verwendet werden, nicht empfohlen. Workloads, die Millisekunden-Reaktionszeiten erfordern und eine einzelne Zeile in einem Dataset anheften möchten, eignen sich nicht gut für serverlose SQL-Pools.
Zu den gängigen Anwendungsfällen für serverlose SQL-Pools gehören:
- Datenexploration: Die Datenerkundung umfasst das Durchsuchen des Datensees, um erste Einblicke zu den Daten zu erhalten und ist mit Azure Synapse Studio leicht erreichbar. Sie können die Dateien in Ihrem verknüpften Datenspeicherspeicher durchsuchen und den integrierten serverlosen SQL-Pool verwenden, um automatisch ein SQL-Skript zu generieren, um TOP 100 Zeilen aus einer Datei oder einem Ordner wie bei einer Tabelle in SQL Server auszuwählen. Von dort aus können Sie Projektionen, Filterung, Gruppierung und den großteil des Vorgangs über die Daten anwenden, als wären die Daten in einer regulären SQL Server-Tabelle enthalten.
- Datentransformation: Während Azure Synapse Analytics großartige Datentransformationsfunktionen mit Synapse Spark bietet, finden einige Datenentwickler möglicherweise die Datentransformation einfacher, um sql zu verwenden. Mit serverlosen SQL-Pool können Sie SQL-basierte Datentransformationen durchführen; entweder interaktiv oder als Teil einer automatisierten Datenpipeline.
- Logisches Data Warehouse: Nach der ersten Erkundung der Daten im Datensee können Sie externe Objekte wie Tabellen und Ansichten in einer serverlosen SQL-Datenbank definieren. Die Daten bleiben in den Data Lake-Dateien gespeichert, werden jedoch von einem relationalen Schema abstrahiert, das von Clientanwendungen und Analysetools verwendet werden kann, um die Daten wie in einer relationalen Datenbank abzufragen, die in SQL Server gehostet wird.