レイク データベースを使う
レイク データベースを作成すると、テーブル スキーマに一致するデータ ファイルをデータ レイク内の適切なフォルダーに格納し、SQL を使ってクエリを実行できるようになります。
サーバーレス SQL プールの使用
サーバーレス SQL プールを使って、SQL スクリプトでレイク データベースのクエリを実行することができます。
たとえば、RetailDB というレイク データベース内に Customer テーブルがあるとします。 次のような標準の SELECT ステートメントを使ってクエリを実行することができます。
USE RetailDB;
GO
SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;
OPENROWSET 関数を使ったり、基となるファイル ストレージからデータにアクセスするための追加のコードを含めたりする必要はありません。 ファイルへのマッピングは、サーバーレス SQL プールによって自動処理されます。
Apache Spark プールの使用
サーバーレス SQL プールを使うだけでなく、Apache Spark プールで Spark SQL を使うことでレイク データベースのテーブルを操作することができます。
たとえば、次のコードを使って Customer テーブルに新しい顧客レコードを挿入できます。
%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')
次に、次のコードを使ってテーブルのクエリを実行できます。
%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123