はじめに

完了

Linux Foundation の Delta Lake は、オープンソースの Spark 用ストレージ レイヤーです。これは、バッチ データとストリーミング データ向けのリレーショナル データベース機能として利用できます。 Delta Lake を使うと、Spark に "データ レイクハウス" アーキテクチャを実装し、トランザクションとスキーマの適用をサポートして SQL ベースのデータ操作セマンティクスをサポートすることができます。 その結果、リレーショナル データベース システムの多くの利点と、データ レイクに格納するデータ ファイルの柔軟性を備えた分析データ ストアが実現します。

このモジュールでは、次の方法を学習します。

  • Delta Lake の主要な特徴と機能について説明する。
  • Synapse Analytics Spark プール内 Delta Lake のテーブルを作成し、使う。
  • Delta Lake データ用の Spark カタログ テーブルを作成する。
  • ストリーミング データに Delta Lake テーブルを使う。
  • Synapse Analytics SQL プールから Delta Lake テーブルのクエリを実行する。

Note

Azure Synapse Analytics プールで使用できる Delta Lake バージョンは、プールの構成に指定されている Spark バージョンによって変わります。 このモジュールの情報は、Spark 3.1 と共にインストールされる Delta Lake バージョン 1.0 を反映しています。