Lakehouse 部署管線和 git 整合(預覽)
Lakehouse 與 Microsoft Fabric 中的生命週期管理功能整合,在整個產品生命週期中提供所有開發小組成員之間的標準化共同作業。 生命週期管理可持續將功能和 Bug 修正傳遞給多個環境,藉此促進有效的產品版本設定和發行程式。 若要深入瞭解,請參閱 什麼是 Microsoft Fabric 中的生命週期管理?。
重要
這項功能處於預覽狀態。
Lakehouse git 整合
Lakehouse 是一個項目,其中包含工作區中多個物件中所參考的中繼資料和資料。 Lakehouse 包含資料表、資料夾和捷徑,做為主要可管理的資料容器項目。 從開發工作流程的觀點來看,下列相依物件可能會參考Lakehouse:
- 資料流 和資料 管線
- Spark 工作定義
- Notebooks
- 語意模型和 Power BI
默認語意模型和 SQL 分析端點中繼資料與 Lakehouse 相關,並預設由 git 更新程式管理。 由於主體 資料不會在 git 中追蹤,只會追蹤中繼資料。
Git 表示
下列 Lakehouse 資訊會在 Git 連線的工作區中串行化及追蹤:
- Display name
- 描述
- 邏輯 guid
注意
追蹤的邏輯 GUID 是自動產生的跨工作區識別碼,代表項目及其原始檔控制表示法。
重要
在目前的體驗中,只有 Lakehouse 容器成品會在 git 中追蹤。 資料表、資料夾、捷徑和其他中繼資料變更不會在 git 中追蹤及建立版本。
Lakehouse git 整合功能
可以使用以下功能:
- 將 Lakehouse 物件中繼資料串行化為 Git JSON 表示法。
- 直接套用變更或使用提取要求來控制上游或下游工作區和分支的變更。
- 在 git 中會追蹤重新命名 Lakehouses。 更新已重新命名的 Lakehouse 也會重新命名預設語意資料模型和 SQL 分析端點。
- 一律不會將任何動作套用至資料表、資料夾和捷徑、中繼資料和資料。
部署管線中的 Lakehouse
Microsoft Fabric 生命週期管理部署管線支援 Lakehouse。 它可啟用環境分割 最佳做法。
Lakehouse 部署管線整合功能:
跨開發、測試和生產工作區進行部署。
在部署時,Lakehouse 可以移除為相依物件。 也支援在部署管線內容中對應不同的 Lakehouse。
如果在部署管線設定期間未指定任何項目,則會在目標工作區中建立具有相同名稱的新空白 Lakehouse 物件。 筆記本和Spark作業定義會重新對應,以參考新工作區中的新Lakehouse物件。
如果 Lakehouse 相依性設定為在部署管線設定期間參考不同的 Lakehouse,例如上游 Lakehouse,目標工作區中仍會建立具有相同名稱的新空白 Lakehouse 物件, 但 Notebooks 和 Spark 作業定義參考會保留至不同的 Lakehouse 要求。
SQL 分析端點和語意模型會布建為 Lakehouse 部署的一部分。
Lakehouse 內不會覆寫任何物件。
您可以在部署管線內容中的工作區之間同步處理 Lakehouse 名稱的更新。