使用差異共用存取與您共享的資料(適用於收件者)
本文說明如何使用 Delta Sharing 存取與您共享的數據。
差異共用和數據收件者
差異共用是安全數據共享的開放標準。 Databricks 使用者在此內容中稱為 數據提供者 ,可以使用 Azure Databricks 上的 Delta Sharing,與組織外部的人員或群組共用數據,稱為 數據收件者。
Databricks-to-Databricks 共用和開啟共用
您存取數據的方式取決於您自己是 Databricks 使用者,以及您的數據提供者是否設定了與您共享的數據,以進行 Databricks 對 Databricks 共用或 開啟共用。
在 Databricks 對 Databricks 模型中,您必須是已啟用 Unity 目錄之 Databricks 工作區的使用者。 小組的成員會為數據提供者提供 Unity 目錄中繼存放區的唯一標識碼,而數據提供者會使用該標識符來建立安全的共享連線。 共用數據會變成可供您工作區存取。 如有必要,小組成員會針對該數據設定細微的訪問控制。
在開啟的共用模型中,您可以使用任何您想要的工具(包括 Databricks)來存取共享數據。 數據提供者會透過安全通道傳送啟用 URL。 您可以遵循它來下載認證檔案,讓您存取與您共享的數據。
共享的數據不是由 Databricks 直接提供,而是由在 Azure Databricks 上執行的數據提供者所提供。
注意
Databricks 可能會收集數據收件者使用和存取共用數據的相關信息(包括識別任何使用認證檔案存取數據的個人或公司,以取得這類資訊),並可與適用的數據提供者共用。
取得與您共享數據的存取權
存取數據的方式取決於您的數據提供者是否使用開放式共用通訊協定或 Databricks-to-Databricks 共用通訊協定與您共享數據。 請參閱 Databricks 對 Databricks 共用和開啟共用。
在 Databricks-to-Databricks 模型中取得存取權
在 Databricks 對 Databricks 模型中:
數據提供者會傳送指示,以尋找與 Databricks 工作區相關聯的 Unity 目錄中繼存放區的唯一標識符,並將它傳送給它們。
共用識別碼是一個字串,其中包含中繼存放區的雲端、區域和 UUID(中繼存放區的唯一標識符),格式為
<cloud>:<region>:<uuid>
。 例如:aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
。若要使用目錄總管取得共享識別碼:
在 Azure Databricks 工作區中,按一下 [目錄]。
在 [目錄] 窗格頂端,按一下齒輪圖示,然後選取 [Delta Sharing]。
或者,從 [快速存取] 頁面,按一下 [Delta Sharing >] 按鈕。
- 在 [ 與我 共用] 索引卷標上,按兩下右上方的 Databricks 共用組織名稱,然後選取 [ 複製共用標識符]。
若要使用筆記本或 Databricks SQL 查詢取得共享識別碼,請使用預設 SQL 函式
CURRENT_METASTORE
。 如果您使用筆記本,則必須在工作區中的共用或單一 使用者叢集 上執行,才能存取共享數據。SELECT CURRENT_METASTORE();
資料提供者會建立:
- 其 Databricks 帳戶中的收件者,代表您將存取數據的組織和組織中的使用者。
- 共用,這是要與您共用之數據表、磁碟區和檢視的表示法。
您可以存取與您共享的數據。 如有需要,您或小組上的某人可以為您的用戶設定該數據的細微數據存取。 請參閱讀取使用 Databricks-to-Databricks 共用的資料(適用於收件者)。
在開啟共用模型中取得存取權
開啟的共用模型中:
資料提供者會建立:
- 其 Databricks 帳戶中的收件者,代表您將存取數據的組織和組織中的使用者。 令牌和認證檔案會作為此組態的一部分產生。
- 共用,這是要與您共用之數據表和數據分割的表示法。
數據提供者會透過安全通道傳送啟用 URL。 您可以遵循它來下載認證檔案,讓您存取與您共享的數據。
重要
請勿與任何人共用啟用連結。 您只能下載認證檔案一次。 如果您在認證檔案已下載之後再次瀏覽啟用連結,則會停用 [ 下載認證檔案 ] 按鈕。
如果您在使用之前遺失啟用連結,請連絡數據提供者。
將認證檔案儲存在安全的位置。
請勿與應該具有共享數據存取權的使用者群組以外的任何人共用認證檔案。 如果您需要與組織中的某人共用,Databricks 建議使用密碼管理員。
讀取共享數據
您如何使用 Delta Sharing 安全地讀取已與您共用的數據,取決於您是否收到認證檔案(開啟共用模型),還是使用 Databricks 工作區,以及您為數據提供者提供共用標識碼(Databricks-to-Databricks 模型)。
使用認證檔案讀取共享資料 (開啟共用)
如果使用 Delta Sharing 開啟共用通訊協定與您共用數據,您可以使用您下載的認證檔案向數據提供者的 Databricks 帳戶進行驗證,並讀取共用數據。 只要基礎令牌有效,且提供者會繼續共享數據,存取就會保存。 提供者會管理令牌到期和輪替。 數據的更新幾乎即時可供您使用。 您可以讀取和製作共享數據的複本,但無法修改源數據。
若要瞭解如何使用 Azure Databricks、Apache Spark、pandas 和 Power BI 中的認證檔案來存取和讀取共享數據,請參閱使用 Delta Sharing 開啟共用來讀取共用的數據(適用於收件者)。
使用 Databricks-to-Databricks 共用讀取共享數據
如果使用 Databricks 對 Databricks 模型與您共用數據,則不需要認證檔案才能存取共享數據。 Databricks 會負責安全連線,且共用的數據會自動在您的 Databricks 工作區中探索。
若要瞭解如何在 Databricks 工作區中尋找、讀取和管理該共用數據,請參閱讀取使用 Databricks 到 Databricks Delta 共用的數據(適用於收件者)。
稽核共享數據的使用量
如果您有 Azure Databricks 工作區的存取權,您可以使用 Azure Databricks 稽核記錄來了解組織中誰正在使用 Delta Sharing 存取哪些數據。 請參閱稽核和監視資料共用。
下一步
- 深入了解 Azure Databricks
- 深入了解差異共用
- 深入瞭解 Unity 目錄