共用方式為


平台管理速查表

本文旨在針對建議的最佳做法,為帳戶和工作區管理員提供明確且有主見的指導。 帳戶或工作區管理員應實作下列做法,以協助最佳化其 Azure Databricks 帳戶中的成本、可觀測性、資料控管和安全性。

如需深入的安全性最佳做法,請參閱此 PDF:Azure Databricks 安全性最佳做法和威脅模型

最佳做法 影響 文件
啟用 Unity Catalog 資料控管:Unity Catalog 可跨 Azure Databricks 工作區提供集中式存取控制、稽核、譜系和資料探索功能。 - 設定和管理 Unity 目錄
套用使用標籤 可觀測性:將使用量對應到相關的離散類別。 指派並強制執行貴組織業務單位、特定專案,以及任何其他使用者或群組的標籤。 - 監視帳戶控制台中的使用量
使用叢集原則 成本:使用自動終止 (用於通用叢集)、最大叢集大小和執行個體類型限制來控制成本。

可檢視性:在您的叢集原則中設定 custom_tags 來強制執行標記。

安全性:將叢集存取模式限制為僅允許使用者建立已啟用 Unity Catalog 的叢集以強制執行資料權限。
- 建立和管理叢集原則
- 使用標籤監視叢集使用量
使用服務主體連線至協力廠商軟體 安全性:服務主體是一種 Databricks 身分識別類型,可讓協力廠商服務直接對 Databricks 進行驗證,無需透過個別使用者的認證。

如果個別使用者的認證發生問題,協力廠商服務也不會中斷。
- 建立和管理服務主體
設定 SCIM 整合 安全性:與識別提供者整合來自動化使用者佈建和取消佈建,而無需手動將使用者新增至 Databricks。 從識別提供者中移除使用者時,也會自動從 Databricks 中移除相應使用者。 - 從識別提供者同步使用者和群組
使用帳戶層級群組管理存取控制 資料控管:建立帳戶層級群組,以便可以大量控制對工作區、資源和資料的存取。 這可讓您不必為所有使用者授與對所有內容的存取權,或為個別使用者授與特定權限。

您也可以將群組從識別提供者同步至 Databricks 群組。
- 管理群組
- 控制資源的存取
- 將群組從 IdP 同步至 Databricks
- 資料控管指南
為 IP 允許清單設定 IP 存取 安全性:IP 存取清單阻止使用者存取不安全網路中的 Azure Databricks 資源。 從不安全的網路存取雲端服務會給企業帶來安全風險,尤其是在使用者可能已獲授權存取敏感資料或個人資料的情況下

請確保為帳戶主控台和工作區設定 IP 存取清單。
- 為工作區建立 IP 存取清單
- 為帳戶主控台建立 IP 存取清單
使用 Databricks 祕密或雲端提供者祕密管理員 安全性:使用 Databricks 祕密可讓您安全地儲存外部資料來源的認證。 無需直接將認證輸入到筆記本中,只需參考祕密即可向資料來源進行驗證。 - 管理 Databricks 祕密
設定個人存取權杖 (PAT) 的到期日 安全性:工作區管理員可以管理使用者、群組和服務主體的 PAT。 設定 PAT 的到期日可降低遺失權杖的風險,或降低可能導致工作區資料外流的持久性權杖的風險。 - 管理個人存取權杖
使用預算警示來監視使用量 可檢視性:根據對組織而言很重要的預算來監視使用量。 預算範例包括:專案、移轉、BU 和每季或年度預算。 - 使用預算來監視帳戶支出
使用系統資料表來監視帳戶使用量 可檢視性:系統資料表是由 Databricks 託管的帳戶操作資料的分析存放區,包括稽核記錄、資料譜系和可計費使用量。 您可以使用系統資料表在整個帳戶中實現可檢視性。 - 使用系統資料表監視使用量