建立乾淨的會議室
重要
這項功能處於公開預覽狀態。
本文說明如何建立一個乾淨的空間、安全且隱私權保護的環境,讓多方可以在不直接存取彼此的數據的情況下,共同處理敏感數據。
開始之前
使用清理室所需的許可權會因工作而異:
若要建立乾淨的會議室,您必須擁有
CREATE CLEAN ROOM
許可權或中繼存放區管理員。建立者會自動指派為其 Unity 目錄中繼存放區中清理室的擁有者。若要起始參與與您共用的全新會議室,您必須是中繼存放區管理員。
共用清理室時,共同作業者的中繼存放區管理員會自動獲指派清理室的擁有權。 中繼存放區管理員可以將擁有權重新指派給非中繼存放區管理員。Databricks 是數據控管的最佳做法,建議將擁有權指派給群組。
如果您的工作區未獲指派中繼存放區管理員,您必須指派角色。 請參閱 指派中繼存放區管理員 和管理 Unity Catalog 對象擁有權。
若要在清理室中新增和移除數據資產和筆記本,您必須是清理室的擁有者,或擁有
MODIFY CLEAN ROOM
清理室的許可權。 此外,您和清潔室的擁有者(如果您不是擁有者)必須在您新增的數據表和檢視表上設置SELECT
,並且必須在您新增的磁碟區上設置READ VOLUME
。
若要瞭解更新乾淨會議室和執行中工作的許可權需求(筆記本),請參閱 管理乾淨的會議室 和 在乾淨的會議室中執行筆記本。
每個中繼存放區最多可以建立五個乾淨的會議室。
步驟 1. 要求共同作業者的共享標識碼
您必須先擁有您要共同作業之組織的 Clean Room 共用標識碼,才能建立乾淨的會議室。 共用識別碼是一個字串,其中包含組織的全域中繼存放區標識碼 + 工作區識別元 + 聯繫人的使用者名稱(電子郵件位址)。 共同作業者可以位於任何雲端或區域中。
連絡共同作業者以要求其共用標識碼。
共同作業者可以使用尋找共用標識碼中的 指示來取得共享標識碼。
步驟 2。 建立潔淨室
若要建立乾淨的房間,您必須使用目錄總管。
在 Azure Databricks 工作區中,按一下 [目錄]。
在 [ 快速存取] 頁面上,按兩下 [ 清理會議室 > ] 按鈕。
或者,按兩下 [目錄] 窗格頂端的齒輪圖示,然後選取 [清理室]。
按兩下 [ 建立清理室]。
在 [ 建立清理室 ] 頁面上,輸入乾淨房間的用戶易記名稱。
名稱無法使用空格、句號或正斜線 (/)。
儲存后,您無法變更乾淨的會議室名稱。 使用共同作業者會尋找有用且描述性的名稱。
選取將建立中央清理室的雲端提供者和區域。
雲端提供者必須與您目前的工作區相同,但區域則不相同。 當您進行選擇時,請考慮貴組織的數據落地或其他原則。
(選擇性) 新增註解。
輸入共同作業者的 清理室共享標識碼。
請參閱 步驟 1。要求共同作業者的共享標識碼。
在完整部署之前,您可以使用共享標識碼或目前中繼存放區中其他使用者的標識碼來測試您的潔淨室。 這樣做會在您目前的中繼存放區中建立兩個乾淨的工作區。 例如,如果您建立名為
test_clean_room
的乾淨房間,也會顯示名為test_clean_room_collaborator
的第二個乾淨房間。 在相同的中繼存放區中,與共同作業者一起運行筆記本,與與外部共同作業者一起運行的方式相同。 請參閱 在無塵室中執行筆記本程式。記下指派給您的目錄名稱(建立者)和共同作業者。
新增至清理室的所有數據資產都會出現在中央清理室的目錄底下,而且可以使用 Unity 目錄三層命名空間中的該目錄來參考 。
<catalog>.<schema>.<table-etc>
選取網路存取原則類型。 建立乾淨空間之後,便無法變更此設定。
- 完整存取:不受限制的向外的網際網路存取。
- 限制存取:這會限制您指定的因特網目的地的輸出存取。 請參閱 網路原則概觀 和 管理無伺服器輸出控制的網路原則。
注意
限制存取 可能會延遲資產可用性長達 10 分鐘,且不支援 Google Cloud 共同作業者。
建立乾淨空間之後,您可以在 [安全性] 索引標籤中檢視網路存取原則。
按兩下 [ 建立清理室]。
步驟 3. 將數據資產和筆記本新增至清理室
清潔室中的任何一方(創建者和協作者)都可以將數據表、數量、檢視和筆記本新增至無塵室。
所需的權限:
您必須是擁有者,或擁有
MODIFY CLEAN ROOM
乾淨的房間許可權。您和無塵室的擁有者(如果您不是擁有者)必須在任何資料表或檢視上有
SELECT
,以及在您添加的任何磁碟區上有READ VOLUME
,並且在父目錄和架構上具備USE CATALOG
和USE SCHEMA
。乾淨的房間擁有者必須在乾淨的房間的一生中保留這些特權。
注意
下列指示假設您返回到已設置的無塵室以新增資產。 如果您剛第一次建立乾淨的空間,精靈會逐步引導您新增數據資產和筆記本。 不論您是由精靈引導,新增這些資產的實際UI都相同。
若要新增資產:
在 Azure Databricks 工作區中,按一下 [目錄]。
在 [ 快速存取] 頁面上,按兩下 [ 清理會議室 > ] 按鈕。
或者,按兩下 [目錄] 窗格頂端的齒輪圖示,然後選取 [清理室]。
尋找並按下您要更新的乾淨空間名稱。
按一下【+ 新增資料資源】以添加資料表、磁碟區或視圖。
選取您要分享的資料資產,然後按一下 新增資料資產。
當您共用數據表、磁碟區或檢視時,可以選擇性地新增別名。 別名名稱將是清理室中唯一可見的名稱。
當您共用數據表時,可以選擇性地新增分割區子句,讓您只共用數據表的一部分。 如需如何使用分割區來限制共用專案的詳細資訊,請參閱 指定要共用的數據表分割區。
若要新增筆記本,請按兩下 [ + 新增筆記本 ] 按鈕,然後流覽您要新增的筆記本。
您可以選擇性地為筆記本提供替代 筆記本名稱。
您在無塵室中共用的筆記本會在您和其他協作者新增至無塵室的表格、檢視和磁碟區上查詢資料並執行數據分析工作負載。
筆記本會以隱含核准的原則運作:您無法執行您所建立的筆記本。 您可以建立共同作業者所使用的筆記本,而共同作業者會建立您使用的筆記本。
如果您共用包含結果的筆記本,這些結果將會與您的共同作業者共用。
您可以使用筆記本來建立 輸出數據表,這些數據表 在執行筆記本時會暫時共用至共同作業者的中繼存放區。 請參閱 在 Databricks Clean Rooms 中建立和使用輸出數據表。
重要
新增至清理室的數據表、檢視或磁碟區之任何筆記本參考,都必須使用建立清理室時所指派的目錄名稱(對於清理室建立者新增的數據資產,使用「建立者」;對於受邀共同作業者新增的數據資產,使用「共同作業者」)。 例如,建立者新增的數據表可以命名為
creator.sales.california
。同樣地,請確認筆記本使用與在潔淨室中的資料資產相關的任何別名。