管理湖存放庫的考量

已完成

管理湖存放庫時有幾項考量,包括如何保護您的湖存放庫,以及如何處理持續整合與持續傳遞 (CI/CD)。

保護您的湖存放庫

確保只有授權使用者可以存取資料,以保護湖存放庫。 在 Fabric 中,您可以藉由在工作區專案層級設定權限來執行此動作。

工作區權限可控制工作區內所有項目的存取權。 專案層級權限可控制工作區內特定項目的存取權,而且當您與不在相同工作區中的同事共同作業,或是他們只需要存取單一特定項目時,即可以使用。

您可以策略性地將湖存放庫的不同層級儲存在不同的工作區中,以改善安全性和有效率的容量管理。 這種方法不僅可增強安全性,還能將成本效益最佳化。

  • 安全性和存取考量:定義每一層需要存取的人員,確保只有授權的人員可以與敏感性資料互動。
  • 金層級存取控制:限制對金層級的存取為唯讀用途,強調最低權限的重要性。
  • 銀層級使用:決定是否允許使用者以銀層級為基礎組建,平衡彈性和安全性。
  • 銅層級存取控制:限制對銅層級的存取為唯讀用途,強調最低權限的重要性。

您應該與組織的安全性小組討論網狀架構內容的共用,以確保其符合組織的安全性原則。

持續整合與持續傳遞 (CI/CD) 考量

為湖存放庫架構設計持續整合/持續部署 (CI/CD) 程序牽涉到數個考慮,以確保順暢且有效率的部署程序。 考慮包括實作資料品質檢查、版本控制、自動化部署、監視和安全性措施。 考量也應該包括可擴縮性、災害復原、共同作業、合規性和持續改善,以確保可靠且有效率的資料管線部署。 雖然其中有些與流程和做法相關,但有些則與用來實作 CI/CD 的工具和技術相關。 網狀架構原生提供數種工具和技術,以支援 CI/CD 程序。

Microsoft Fabric 中的 Git 整合可讓您將開發程序、工具和最佳做法直接整合到 Fabric 平台中。 網狀架構的 Git 整合可啟用資料小組備份和版本工作、視需要還原為先前階段、使用 Git 分支單獨與其他人員共同作業,以及利用熟悉的原始檔控制工具功能來管理 Fabric 項目。

注意

Git 整合簡介中深入了解 Fabric 中的 Git 整合。

CI/CD 在湖存放庫的黃金層級很重要,因為它可確保可用的高品質、已驗證和可靠資料。 自動化流程可持續整合新的資料、資料轉換和更新,減少手動錯誤,並提供一致且最新的深入解析給下游使用者和應用程式。 這可增強資料正確性、加速決策,並有效地支援資料驅動計畫。