使用資料湖資料庫
建立資料湖資料庫之後,您可以將符合資料表結構描述的資料檔案,儲存在資料湖中適當的資料夾,並使用 SQL 來查詢。
使用無伺服器 SQL 集區
在 SQL 指令碼中,您可以使用無伺服器 SQL 集區來查詢資料湖資料庫。
例如,假設有一個資料湖資料庫,名為 RetailDB,包含 Customer 資料表。 您可以使用標準 SELECT 陳述式來查詢,如下所示:
USE RetailDB;
GO
SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;
從基礎檔案儲存體存取資料並不需要使用 OPENROWSET 函式,也無須加上任何額外的程式碼。 無伺服器 SQL 集區會替您對應至檔案。
使用 Apache Spark 集區
除了使用無伺服器 SQL 集區,您還可以在 Apache Spark 集區使用 Spark SQL 來處理資料湖資料庫的資料表。
例如,您可以使用下列程式碼,將新的客戶記錄插入 Customer 資料表。
%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')
然後使用下列程式碼來查詢資料表:
%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123