클린룸 만들기
이 문서에서는 서로의 데이터에 직접 액세스하지 않고도 여러 당사자가 중요한 엔터프라이즈 데이터에 대해 함께 작업할 수 있는 안전한 개인 정보 보호 환경인 클린룸을 만드는 방법을 설명합니다.
시작하기 전에
클린룸을 사용하는 데 필요한 권한은 작업에 따라 달라집니다.
클린룸을 만들려면
CREATE CLEAN ROOM
권한이 있거나 metastore 관리자여야 합니다. 작성자는 Unity 카탈로그 메타스토어에서 클린룸의 소유자로 자동으로 할당됩니다.공유된 클린룸에서 참여를 시작하려면 메타스토어 관리자여야 합니다.
클린룸을 공유하면 공동 작업자 조직의 metastore 관리자에게 클린룸의 소유권이 자동으로 할당됩니다. metastore 관리자는 메타스토어가 아닌 관리자에게 소유권을 다시 할당할 수 있습니다. 데이터 거버넌스에 대한 모범 사례로 Databricks는 소유권을 그룹에 할당하는 것이 좋습니다.
작업 영역에 metastore 관리자가 할당되지 않은 경우 역할을 할당해야 합니다. 메타스토어 관리자 할당 및 Unity 카탈로그 개체 소유권 관리를 참조하세요.
클린룸에서 데이터 자산 및 Notebook을 추가하고 제거하려면 클린룸의 소유자이거나 클린룸에서
MODIFY CLEAN ROOM
권한이 있어야 합니다. 또한 사용자와 클린룸의 소유자(소유자가 아닌 경우)는 추가한 테이블 및 뷰에SELECT
를, 추가한 볼륨에는READ VOLUME
을 반드시 포함해야 합니다.
클린룸을 업데이트하고 클린룸에서 작업(전자 필기장)을 실행하기 위한 사용 권한 요구 사항에 대해 알아보려면 클린룸 관리 및 클린룸에서 전자 필기장 실행을 참조하세요.
메타스토어당 최대 5개의 클린룸을 만들 수 있습니다.
1단계. 공동 작업자의 공유 식별자 요청
클린룸을 만들려면 먼저 공동 작업할 조직의 클린룸 공유 식별자가 있어야 합니다. 공유 식별자는 조직의 전역 메타스토어 ID + 작업 영역 ID + 연락처의 사용자 이름(이메일 주소)으로 구성된 문자열입니다. 협력자는 모든 클라우드 또는 지역에 있을 수 있습니다.
공동 작업자에게 연락하여 공유 식별자를 요청합니다.
공동 작업자는 지침에서공유 식별자 찾기 방법을 참조하여 공유 식별자를 가져올 수 있습니다.
2단계. 클린룸 생성
클린룸을 만들려면 카탈로그 탐색기를 사용해야 합니다.
Azure Databricks 작업 영역에서
카탈로그를 클릭합니다.
빠른 액세스
또는
카탈로그 창 맨 위에 있는 기어 아이콘을 클릭하고 클린 룸선택합니다.
클린 룸 만들기를 클릭합니다.
클린룸 만들기 페이지에서 클린룸의 사용자 친화적인 이름을 입력합니다.
이름은 공백, 마침표 또는 슬래시(/)를 사용할 수 없습니다.
클린룸 이름을 저장한 후에는 변경할 수 없습니다. 공동 작업자가 유용하고 설명적인 이름을 사용합니다.
중앙 클린룸을 만들 클라우드 공급자 및 지역을 선택합니다.
클라우드 공급자는 현재 작업 영역과 동일해야 하지만 지역은 그렇지 않습니다. 선택할 때 조직의 데이터 상주 또는 기타 정책을 고려합니다.
(선택 사항) 주석을 입력합니다.
공동 작업자의 클린룸 공유 식별자입력합니다.
1단계를 참조하세요. 공동 작업자의 공유 식별자요청합니다.
현재 메타스토어에서 공유 식별자 또는 다른 사용자의 식별자를 사용하여 전체 배포 전에 클린룸을 테스트할 수 있습니다. 이렇게 하면 현재 메타스토어에 두 개의 클린룸이 만들어집니다. 예를 들어
test_clean_room
이라는 클린룸을 만들면test_clean_room_collaborator
라는 두 번째 클린룸도 나타납니다. 같은 메타스토어에서 협업자와 노트북을 실행하는 것은 외부 협업자와의 실행과 동일하게 작동합니다. 클린룸에서 전자 필기장을 실행하는을 참조하세요.사용자(작성자)와 공동 작업자에게 할당된 카탈로그 이름을 기록해 둡니다.
클린 룸에 추가된 모든 데이터 자산은 중앙 클린룸의 해당 카탈로그 아래에 표시되며 Unity 카탈로그 3단계 네임스페이스(
<catalog>.<schema>.<table-etc>
)에서 해당 카탈로그를 사용하여 참조할 수 있습니다.네트워크 액세스 정책 유형을 선택합니다. 클린룸을 만든 후에는 변경할 수 없습니다.
- 전체 접근: 무제한 외부 인터넷 접근.
- 제한된 액세스: 지정한 인터넷 대상에 대한 아웃바운드 액세스를 제한합니다. 네트워크 정책 개요 및 서버리스 송신 제어대한 네트워크 정책 관리를 참조하세요.
참고 항목
제한된 액세스 최대 10분 동안 자산 가용성을 지연할 수 있으며 Google Cloud 협력자를 지원하지 않습니다.
클린룸을 만든 후 보안 탭에서 네트워크 액세스 정책을 볼 수 있습니다.
클린 룸 만들기를 클릭합니다.
현재 작업 영역이 HIPAA 규정 준수 보안 프로필로 설정된 경우 클린룸을 만들 때 해당 설정이 중앙 클린룸에 적용됩니다. 공동 작업자는 동일한 보안 프로필이 있는 작업 영역에서 클린룸에 액세스해야 합니다. 준수 보안 프로필참조하세요.
3단계. 클린룸에 데이터 자산 및 Notebook 추가
클린룸의 각 측(작성자 및 공동 작업자)은 테이블, 볼륨, 뷰 및 전자 필기장을 클린룸에 추가할 수 있습니다.
권한 필요:
사용자는 소유자이거나 클린룸에
MODIFY CLEAN ROOM
대한 권한이 있어야 합니다.사용자와 클린룸 소유자(소유자가 아닌 경우)는 부모 카탈로그 및 스키마에
SELECT
및READ VOLUME
가 있어야 하며, 추가하는 모든 테이블 또는 뷰에는USE CATALOG
이, 모든 볼륨에는USE SCHEMA
이 있어야 합니다.깨끗한 방 소유자는 깨끗한 방의 수명 내내 이러한 권한을 유지해야 합니다.
참고 항목
다음 지침에서는 자산을 추가하기 위해 이미 만든 클린룸으로 돌아가고 있다고 가정합니다. 방금 클린룸을 처음 만든 경우 마법사에서 데이터 자산 및 Notebook 추가를 안내합니다. 이러한 자산을 추가하기 위한 실제 UI는 마법사에서 안내하는지 여부에 관계없이 동일합니다.
자산을 추가하려면 다음을 수행합니다.
Azure Databricks 작업 영역에서
카탈로그를 클릭합니다.
빠른 액세스
또는
카탈로그 창 맨 위에 있는 기어 아이콘을 클릭하고 클린 룸선택합니다.
업데이트하려는 클린룸의 이름을 찾아 클릭합니다.
+ 데이터 자산을 클릭하여 테이블, 볼륨 또는 뷰를 추가합니다.
공유하려는 데이터 자산을 선택하고 데이터 자산추가를 클릭합니다.
테이블, 볼륨 또는 뷰를 공유하는 경우 필요에 따라 별칭을 추가할 수 있습니다. 별칭 이름은 클린룸에 표시되는 유일한 이름입니다.
테이블을 공유할 때 필요에 따라 테이블의 일부만 공유할 수 있는 파티션 절을 추가할 수 있습니다. 파티션을 사용하여 공유하는 항목을 제한하는 방법에 대한 자세한 내용은 공유할 테이블 파티션 지정을 참조하세요.
참고 항목
페더레이션 테이블 공유를 위한 프라이빗 미리 보기에 참여하려면 Azure Databricks 계정 담당자에게 문의하세요. 레이크하우스 페더레이션이란 무엇인가?.
전자 필기장을 추가하려면 + 전자 필기장 추가 단추를 클릭하고 추가할 전자 필기장을 찾습니다.
필요에 따라 전자 필기장 이름을 대체 전자 필기장 이름으로 지정할 수 있습니다.
클린룸에서 공유된 노트북은 사용자와 다른 협력자들이 클린룸에 추가한 테이블, 뷰 및 볼륨의 데이터를 쿼리하고 데이터 분석 워크로드를 실행합니다.
Notebook은 암시적 승인 원칙에 따라 작동합니다. 이 원칙 때문에 사용자가 스스로 만든 노트북을 실행할 수 없습니다. 공동 작업자가 사용하는 Notebook을 만들고 공동 작업자가 사용하는 Notebook을 만듭니다.
결과를 포함하는 Notebook을 공유하는 경우 해당 결과는 공동 작업자와 공유됩니다.
Notebook을 사용하여 출력 테이블을 생성하고, 이를 notebook 실행 시 공동 작업자의 metastore에 일시적으로 공유할 수 있습니다. Databricks Clean Rooms에서 출력 테이블을 만들고 작업하는 방법은 및을 참조하세요.
테스트 데이터 세트를 사용하려면 샘플 노트북을 다운로드하세요.
Important
클린룸에 추가된 테이블, 뷰 또는 볼륨에 대한 전자 필기장 참조는 클린룸을 만들 때 할당된 카탈로그 이름(클린룸 작성자가 추가한 데이터 자산의 경우 "작성자", 초대된 협력자가 추가한 데이터 자산의 경우 "협력자")을 사용해야 합니다. 예를 들어 작성자가 추가한 테이블의 이름은
creator.sales.california
.또한 노트북이 클린룸의 데이터 자산에 할당된 별칭을 사용하고 있는지 확인합니다.