다음을 통해 공유


클린룸 만들기

Important

이 기능은 공개 미리 보기 상태입니다.

이 문서에서는 서로의 데이터에 직접 액세스하지 않고도 여러 당사자가 중요한 엔터프라이즈 데이터에 대해 함께 작업할 수 where 클린룸, 보안 및 개인 정보 보호 환경을 만드는 방법을 설명합니다.

시작하기 전에

클린룸을 사용하는 데 필요한 권한은 작업에 따라 달라집니다.

  • 클린룸을 만들려면 CREATE CLEAN ROOM 권한이 있거나 metastore 관리자여야 합니다. 작성자는 Unity Catalog 메타스토어에서 클린룸의 소유자로 자동으로 할당됩니다.

  • 공유된 클린룸에서 참여를 시작하려면 메타스토어 관리자여야 합니다.

    클린룸을 공유하면 공동 작업자 조직의 metastore 관리자에게 클린룸의 소유권이 자동으로 할당됩니다. metastore 관리자는 메타스토어가 아닌 관리자에게 소유권을 다시 할당할 수 있습니다. 데이터 거버넌스에 대한 모범 사례로 Databricks는 소유권을 그룹에 할당하는 것이 좋습니다.

    작업 영역에 metastore 관리자가 할당되지 않은 경우 역할을 할당해야 합니다. 메타스토어 관리자 할당 및 Unity 개체 소유권관리 참조하세요.

  • 클린룸에서 데이터 자산과 노트북을 추가하고 remove 작업을 수행하려면 클린룸의 소유자이거나 클린룸에 대한 MODIFY CLEAN ROOM 권한이 있어야 합니다. 또한 귀하와 클린룸 소유자(소유자가 아닌 경우)는 귀하가 추가한 SELECT는 tables 및 views에, 그리고 귀하가 추가한 READ VOLUME는 volumes에 있어야 합니다.

클린룸을 업데이트하고 클린룸에서 작업(전자 필기장)을 실행하기 위한 사용 권한 요구 사항에 대해 알아보려면 클린룸 관리 및 클린룸에서 전자 필기장 실행을 참조하세요.

메타스토어당 최대 5개의 클린룸을 만들 수 있습니다.

1단계. 공동 작업자에게 identifier 공유를 요청

먼저 공동 작업할 조직의 클린룸 공유 identifier이 있어야만 클린룸을 만들 수 있습니다. 공유 문자열 identifier는 조직의 전역 메타스토어 ID, 작업 영역 ID, 그리고 연락처의 사용자 이름(이메일 주소)으로 구성된 문자열입니다. 협력자는 모든 클라우드 또는 지역에 있을 수 있습니다.

공동 작업자에게 연락하여 공유 identifier를 요청하도록 합니다.

공동 작업자는 공유 찾기 identifier의 지침을 사용하여 identifier 공유를 get할 수 있습니다.

2단계. 클린룸 생성

클린룸을 만들려면 Catalog Explorer를 사용해야 합니다.

  1. Azure Databricks 작업 영역에서 Catalog 아이콘Catalog클릭합니다.

  2. 빠른 액세스>

    또는 Catalog 창 맨 위에 있는 기어 아이콘 기어 아이콘을 클릭하고, 그리고 select클린 룸.

  3. 클린 룸 만들기를 클릭합니다.

  4. 클린룸 만들기 페이지에서 클린룸의 사용자 친화적인 이름을 입력합니다.

    이름은 공백, 마침표 또는 슬래시(/)를 사용할 수 없습니다.

    클린룸 이름을 저장한 후에는 변경할 수 없습니다. 공동 작업자가 유용하고 설명적인 이름을 사용합니다.

  5. Select 클라우드 공급자와 where 지역에 중앙 클린 룸이 만들어집니다.

    클라우드 공급자는 현재 작업 영역과 동일해야 하지만 지역은 그렇지 않습니다. 선택할 때 조직의 데이터 상주 또는 기타 정책을 고려합니다.

  6. (선택 사항) 주석을 입력합니다.

  7. 공동 작업자의 클린룸 공유 identifier입력합니다.

    1단계를 참조하세요. 그리고 공동 작업자가 공유하도록 identifier요청합니다.

    공유 identifier 또는 현재 메타스토어에 있는 다른 사용자의 identifier 사용하여 전체 배포 전에 클린룸을 테스트할 수 있습니다. 이렇게 하면 현재 메타스토어에 두 개의 클린룸이 만들어집니다. 예를 들어 test_clean_room이라는 클린룸을 만들면 test_clean_room_collaborator라는 두 번째 클린룸도 나타납니다. 같은 메타스토어에서 협업자와 노트북을 실행하는 것은 외부 협업자와의 실행과 동일하게 작동합니다. 클린룸에서 전자 필기장을 실행하는을 참조하세요.

  8. 당신(제작자)과 공동 작업자에게 할당된 catalog 이름을 기록해 두세요.

    클린 룸에 추가된 모든 데이터 자산은 중앙 클린룸의 해당 catalog 아래에 표시되며 Unity Catalog 3개 수준 네임스페이스(<catalog>.<schema>.<table-etc>)에서 해당 catalog 사용하여 참조할 수 있습니다.

  9. Select 네트워크 액세스 정책 유형입니다. 클린룸을 만든 후에는 변경할 수 없습니다.

    • 전체 접근: 무제한 외부 인터넷 접근.
    • 제한된 액세스: 지정한 인터넷 대상에 대한 아웃바운드 액세스를 제한합니다. 네트워크 정책 개요서버리스 송신 제어대한 네트워크 정책 관리를 참조하세요.

    참고 항목

    제한된 액세스 최대 10분 동안 자산 가용성을 지연할 수 있으며 Google Cloud 협력자를 지원하지 않습니다.

    클린룸을 만든 후 보안 탭에서 네트워크 액세스 정책을 볼 수 있습니다.

  10. 클린 룸 만들기를 클릭합니다.

3단계. 클린룸에 데이터 자산 및 Notebook 추가

클린룸에 있는 양측(제작자와 공동 작업자) 중 어느 쪽이든 tables, volumes, views및 전자 필기장을 추가할 수 있습니다.

권한 필요:

  • 사용자는 소유자이거나 클린룸에 MODIFY CLEAN ROOM 대한 권한이 있어야 합니다.

  • 귀하와 클린룸 소유자(소유자가 아닌 경우)는 모든 table 보기에서 SELECT이 있어야 하며, 귀하가 추가하는 모든 볼륨에서 READ VOLUME가 있어야 하고, 부모 catalog 및 schema에서 USE CATALOGUSE SCHEMA가 있어야 합니다.

    깨끗한 방 소유자는 깨끗한 방의 수명 내내 이러한 권한을 유지해야 합니다.

참고 항목

다음 지침에서는 자산을 추가하기 위해 이미 만든 클린룸으로 돌아가고 있다고 가정합니다. 방금 클린룸을 처음 만든 경우 마법사에서 데이터 자산 및 Notebook 추가를 안내합니다. 이러한 자산을 추가하기 위한 실제 UI는 마법사에서 안내하는지 여부에 관계없이 동일합니다.

자산을 추가하려면 다음을 수행합니다.

  1. Azure Databricks 작업 영역에서 Catalog 아이콘Catalog클릭합니다.

  2. 빠른 액세스>

    또는 Catalog 창 맨 위에 있는 기어 아이콘 기어 아이콘을 클릭하고, select클린 룸을(를) 선택하십시오.

  3. update하고자 하는 클린룸의 이름을 찾아 클릭합니다.

  4. 을 클릭하고 데이터 자산을 추가하여 tables, volumes, 또는 views를 추가합니다.

  5. Select 공유하려는 데이터 자산을 선택하고 데이터 자산 추가를 클릭합니다.

    table, 볼륨 또는 뷰를 공유하는 경우 필요에 따라 별칭을 추가할 수 있습니다. 별칭 이름은 클린룸에 표시되는 유일한 이름입니다.

    table을(를) 공유할 때 옵션으로 table의 일부만 공유할 수 있는 partition 절을 추가할 수 있습니다. 파티션을 사용하여 공유하는 항목을 limit 방법에 대한 자세한 내용은 공유할 table 파티션 지정을 참조하세요.

  6. 전자 필기장을 추가하려면 + 전자 필기장 추가 단추를 클릭하고 추가할 전자 필기장을 찾습니다.

    필요에 따라 전자 필기장 이름을 대체 전자 필기장 이름으로 지정할 수 있습니다.

    클린룸에서 공유하는 Notebook은 데이터 쿼리와 tables, views및 volumes를 포함하여 여러분과 다른 공동 작업자가 클린룸에 추가한 데이터 분석 워크로드를 실행합니다.

    Notebook은 암시적 승인 원칙에 따라 작동합니다. 이 원칙 때문에 사용자가 스스로 만든 노트북을 실행할 수 없습니다. 공동 작업자가 사용하는 Notebook을 만들고 공동 작업자가 사용하는 Notebook을 만듭니다.

    결과를 포함하는 Notebook을 공유하는 경우 해당 결과는 공동 작업자와 공유됩니다.

    Notebook을 사용하여 노트북을 실행할 때 생성되는 출력 tables을(를) 공동 작업자의 메타스토어에 일시적으로 공유할 수 있습니다. Databricks Clean Rooms에서 출력 tables 만들기 및 작업을 참조하세요.

    테스트 데이터 세트를 사용하려면 샘플 노트북을 다운로드하세요.

    Important

    클린룸에 추가된 tables, views또는 volumes 대한 전자 필기장 참조는 클린룸을 만들 때 할당된 catalog 이름(클린룸 작성자가 추가한 데이터 자산의 경우 "작성자", 초대된 협력자가 추가한 데이터 자산의 경우 "협력자")을 사용해야 합니다. 예를 들어, 작성자가 추가한 table는 creator.sales.california로 이름을 지정할 수도 있습니다.

    또한 노트북이 클린룸의 데이터 자산에 할당된 별칭을 사용하고 있는지 확인합니다.