Verwenden einer Lake-Datenbank

Abgeschlossen

Nach dem Erstellen einer Lake-Datenbank können Sie Datendateien, die den Tabellenschemas entsprechen, in den entsprechenden Ordnern im Data Lake speichern und mithilfe von SQL abfragen.

Verwenden eines serverlosen SQL-Pools

Sie können eine Lake-Datenbank in einem SQL-Skript abfragen, indem Sie einen serverlosen SQL-Pool verwenden.

Angenommen, eine Lake-Datenbank mit dem Namen RetailDB enthält eine Tabelle Customer (Kunden). Sie können sie mithilfe einer standardmäßigen SELECT-Anweisung wie folgt abfragen:

USE RetailDB;
GO

SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;

Es ist nicht erforderlich, eine OPENROWSET-Funktion zu verwenden oder zusätzlichen Code für den Zugriff auf die Daten im zugrunde liegenden Dateispeicher einzuschließen. Der serverlose SQL-Pool übernimmt die Zuordnung der Dateien für Sie.

Verwenden eines Apache Spark-Pools

Zusätzlich zur Verwendung eines serverlosen SQL-Pools können Sie mithilfe von Spark SQL in einem Apache Spark-Pool mit Tabellen in einer Lake-Datenbank arbeiten.

Sie können z. B. den folgenden Code verwenden, um einen neuen Kundendatensatz in die Tabelle Customer einzufügen.

%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')

Anschließend können Sie den folgenden Code verwenden, um die Tabelle abzufragen:

%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123