共用方式為


Delta Lake 數據表格式互操作性

在 Microsoft Fabric 中,Delta Lake 數據表格式是分析的標準。 Delta Lake 是一種開放原始碼儲存層,將原子性、一致性、隔離性、持久性(ACID)交易引入巨量資料和分析工作負載。

所有網狀架構體驗都會產生和使用 Delta Lake 數據表、推動互操作性和統一的產品體驗。 一個計算引擎所產生的 Delta Lake 數據表,例如網狀架構數據倉儲或 Synapse Spark,可由任何其他引擎取用,例如 Power BI。 當您將數據內嵌至 Fabric 時,Fabric 預設會將它儲存為 Delta 資料表。 您可以使用 OneLake 快捷方式,輕鬆地整合包含 Delta Lake 數據表的外部數據。

Delta Lake 功能和網狀架構體驗

為了達到互操作性,所有的 Fabric 體驗在 Delta Lake 特性和 Fabric 功能上都對齊。 有些體驗只能寫入 Delta Lake 數據表,有些則只能從中讀取。

  • 寫入器:數據倉儲、事件串流和導出 Power BI 語意模型至 OneLake
  • 讀者:SQL 分析端點和 Power BI Direct Lake 語意模型
  • 寫入器和讀取器:Fabric Spark 運行時間、數據流、數據管線和 Kusto 查詢語言 (KQL) 資料庫

下列矩陣顯示主要 Delta Lake 功能,以及對每項 Fabric 功能的支援。

網狀架構功能 以名稱為基礎的欄位映射 刪除向量 V 順序寫入 數據表優化和維護 寫入分區 讀取分割區 液體群集 TIMESTAMP_NTZ Delta 讀取器/寫入器版本和預設資料表功能
數據倉儲 Delta Lake 導出 是的 是的 是的 是的 讀者:3
作者:7
刪除向量
SQL 分析端點 是的 是的 N/A (不適用) N/A (不適用) N/A (不適用) 是的 是的 N/A (不適用)
Fabric Spark 執行環境 1.3 是的 是的 是的 是的 是的 是的 是的 是的 讀者:1
作者:2
Fabric Spark 運行時環境 1.2 是的 是的 是的 是的 是的 是的 是,唯讀 是的 讀者:1
作者:2
Fabric Spark 執行環境 1.1 是的 是的 是的 是的 是的 是,唯讀 讀者:1
作者:2
數據流 是的 是的 是的 是的 是的 是,唯讀 讀者:1
作者:2
數據管線 是的 是,僅覆寫 是的 是,唯讀 讀者:1
作者:2
Power BI Direct Lake 語意模型 是的 是的 N/A (不適用) N/A (不適用) N/A (不適用) 是的 是的 N/A (不適用)
將Power BI語意模型導出至 OneLake 是的 N/A (不適用) 是的 是的 N/A (不適用) 讀者:2
作家:5
KQL 資料庫 是的 是的 * 是的 是的 讀者:1
作者:1
事件流 是的 N/A (不適用) 讀者:1
作者:2

* KQL 資料庫提供某些表格維護功能,例如 保留。 數據會在 OneLake 保留期間結束時移除。 如需詳細資訊,請參閱 邏輯複製

注意

  • Fabric 預設不會寫入基於名稱的欄位對應。 默認網狀架構體驗會產生跨服務相容的數據表。 第三方服務所產生的 Delta Lake 可能會有不相容的數據表功能。
  • 某些 Fabric 環境沒有繼承的表格優化和維護功能,例如 bin-compaction、V-order,以及清理舊的未參考檔案功能。 若要讓 Delta Lake 數據表保持最佳分析效果,請遵循 使用數據表維護功能來管理使用這些體驗內嵌之數據表的 Fabric 差異數據表。

目前的限制

目前,Fabric 不支援下列 Delta Lake 功能:

  • Delta Lake 3.x Uniform
  • 身分識別資料行寫入(Databricks 專有功能)
  • Delta Live Tables(Databricks 的專有功能)
  • 在檢查點檔案上啟用的 RLE (執行長度編碼)