共用方式為


使用 Delta Sharing Databricks-to-Databricks 通訊協議共享數據(適用於提供者)

本文概述如何使用 Databricks-to-Databricks Delta Sharing 安全地與任何 Databricks 使用者共用數據,不論帳戶或雲端主機為何,只要該用戶能夠存取已啟用 Unity 目錄的工作區。

注意

如果您是數據收件者(共用 Databricks 數據的使用者或使用者群組),請參閱使用差異共用存取與您共用的數據(適用於收件者)。

誰應該使用 Databricks 到 Databricks Delta Sharing?

使用 Delta Sharing 共用數據的方式有三種。

  1. 本文所涵蓋的 Databricks 對 Databricks 共用通訊協定,可讓您與同時可存取已啟用 Unity 目錄之 Databricks 工作區的使用者共用已啟用 Unity 目錄的工作區中的數據。

    此方法使用 Azure Databricks 內建的 Delta Sharing 伺服器,並針對提供者和收件者提供筆記本共用、Unity 目錄數據控管、稽核和使用量追蹤的支援。 與 Unity 目錄的整合可簡化提供者和收件者的設定和控管,並改善效能。

  2. Databricks 開啟共用通訊協定 可讓您與任何運算平臺上的用戶共用在已啟用 Unity 目錄的 Databricks 工作區中管理的數據。

    請參閱使用 Delta Sharing 開放式共用通訊協定來共用資料(適用於提供者)。

  3. 開放原始碼 Delta Sharing 伺服器的 客戶管理實作可讓您從任何平台共用至任何平臺,不論 Databricks 是否共用。

    請參閱 github.com/delta-io/delta-sharing

如需差異共用的簡介,以及這三種方法的詳細資訊,請參閱 什麼是差異共用?

Databricks 對 Databricks Delta 共用工作流程

本節提供 Databricks 到 Databricks 共用工作流程的高階概觀,其中包含每個步驟的詳細文件連結。

在 Databricks 對 Databricks Delta 共用模型中:

  1. 數據收件者為數據提供者提供 Databricks Unity 目錄中繼存放區的唯一共享標識碼,該中繼存放區附加至收件者(代表使用者或使用者群組)將用來存取數據提供者所共享的數據。

    如需詳細資訊,請參閱 步驟 1:要求收件者的共享標識碼

  2. 數據提供者會在提供者的 Unity 目錄中繼存放區中建立 共用 。 這個具名物件包含在中繼存放區中註冊的數據表、檢視、磁碟區和筆記本集合。

    如需詳細資訊,請參閱 建立和管理差異共用的共用。

  3. 數據提供者會在提供者的 Unity 目錄中繼存放區中建立收件者物件。 這個具名物件代表將存取共用內含數據的使用者或使用者群組,以及附加至使用者或使用者群組將用來存取共用之工作區的 Unity 目錄中繼存放區的共享識別符。 共用識別碼是啟用安全連線的金鑰標識碼。

    如需詳細資訊,請參閱 步驟 2:建立收件者

  4. 數據提供者會將共用的存取權授與收件者。

    如需詳細資訊,請參閱管理對 Delta Sharing 數據共用的存取權(適用於提供者)。

  5. 共用會在收件者的 Databricks 工作區中變成可用,使用者可以使用目錄總管、Databricks CLI 或 Azure Databricks 筆記本或 Databricks SQL 查詢編輯器中的 SQL 命令來存取它。

    若要存取共用中的數據表、檢視、磁碟區和筆記本,中繼存放區管理員或 特殊許可權用戶 必須從共用建立目錄。 然後,授與適當許可權的使用者或其他使用者,即可讓其他使用者存取目錄中的目錄和物件。 授與共用目錄和數據資產的許可權的運作方式,就像在 Unity 目錄中註冊的任何其他資產一樣,重要區別在於使用者只能授與從 Delta Sharing 共用建立之目錄中對象的讀取許可權。

    共用筆記本位於目錄層級,且具有 USE CATALOG 目錄許可權的任何使用者都可以存取它們。

    如需詳細資訊,請參閱使用 Databricks-to-Databricks Delta Sharing 讀取共用的數據(適用於收件者)。

使用歷程記錄共用改善數據表讀取效能

重要

這項功能處於 公開預覽

Databricks 對 Databricks 數據表共用可以藉由啟用歷程記錄共用來改善效能。 共用歷程記錄透過使用來自雲端儲存的暫時安全憑證來改善效能,將範圍縮減至提供者的共用 Delta 資料表的根目錄,從而實現與直接存取源數據表相當的效能。

  • 針對新的資料表共用,請在建立資料表共用時指定 WITH HISTORY。 請參閱 新增表格至共享
  • 對於現有的數據表共用,您必須更改設定以分享數據表歷程記錄。 請參閱 更新的共用資訊

注意

已啟用數據分割的數據表不會收到歷程記錄共用的效能優點。 請參閱 指定要共享的資料表分區

歷史共享數據隱私

提供者應該注意,Databricks 對 Databricks 歷程記錄共用會授予 Delta 共用接收者對數據檔案和 Delta 日誌的臨時讀取存取權。 Delta 日誌包含每個數據表版本的提交記錄、提交者的相關信息(類似於 GitHub 提交記錄),以及尚未清理的已刪除數據。