簡介
Linux 基礎 Delta Lake 是 Spark 的開放原始碼儲存層,可針對批次和串流資料啟用關聯式資料庫功能。 藉由使用 Delta Lake,您可以在 Spark 中實作「資料湖存放庫」架構,以支援 SQL 型的資料操作語意,並支援強制執行交易和結構描述。 其實作結果是建立一個分析資料存放區,可提供關聯式資料庫系統的許多優點,並具備資料湖中資料檔案儲存體的彈性。
在本課程模組中,您將了解如何:
- 描述 Delta Lake 的核心特性和功能。
- 在 Synapse Analytics Spark 集區中建立及使用 Delta Lake 資料表。
- 建立 Delta Lake 資料的 Spark 目錄資料表。
- 使用 Delta Lake 資料表來處理串流資料。
- 從 Synapse Analytics SQL 集區查詢 Delta Lake 資料表。
注意
Azure Synapse Analytics 集區中可用的 Delta Lake 版本取決於集區設定中所指定的 Spark 版本。 本課程模組中的資訊反映的是與 Spark 3.1 一起安裝的 Delta Lake 1.0 版。