델타 공유를 사용하여 당신과 공유된 데이터에 액세스하십시오(recipients)
이 문서에서는 델타 공유를 사용하여 공유된 데이터에 액세스하는 방법을 보여줍니다.
델타 공유 및 데이터 recipients
델타 공유는 보안 데이터 공유를 위한 개방형 표준입니다. 이 컨텍스트에서 데이터 공급자라고 하는 Databricks 사용자는 Azure Databricks에서 델타 공유를 사용하여 데이터 수신자라고 하는 조직 외부의 사용자 또는 그룹과 데이터를 공유할 수 있습니다.
Databricks 간 공유 및 열린 공유
데이터에 액세스하는 방법은 자신이 Databricks 사용자인지 여부와 데이터 공급자가 Databricks 간 공유 또는 열린 공유를 위해 사용자와 공유되는 데이터를 구성했는지 여부에 따라 다릅니다.
Databricks-databricks 모델Unity Catalog사용하도록 설정된 Databricks 작업 영역의 사용자여야 합니다. 팀 구성원은 데이터 공급자에게 Unity Catalog 메타스토어에 대한 고유한 identifier 제공하며, 데이터 공급자는 이를 사용하여 보안 공유 연결을 만듭니다. 공유 데이터는 작업 영역에서 액세스할 수 있게 됩니다. 필요한 경우 팀 멤버가 해당 데이터에 대한 세분화된 액세스 제어를 구성합니다.
열린 공유 모델에서 원하는 모든 도구(Databricks 포함)를 사용하여 공유 데이터에 액세스할 수 있습니다. 데이터 공급자는 보안 채널을 통해 활성화 URL을 보냅니다. 이에 따라 사용자와 공유된 데이터에 액세스할 수 있는 자격 증명 파일을 다운로드합니다.
공유 데이터는 Databricks에서 직접 제공되는 것이 아니라 Azure Databricks에서 실행 중인 데이터 providers에서 제공됩니다.
참고 항목
Databricks는 데이터 recipients사용 및 공유 데이터에 대한 액세스(이러한 정보와 관련하여 자격 증명 파일을 사용하여 데이터에 액세스하는 개인 또는 회사 식별 포함)에 대한 정보를 수집하고 해당 데이터 공급자와 공유할 수 있습니다.
사용자와 공유된 데이터에 대한 액세스 Get
데이터에 액세스하는 방법은 데이터 공급자가 열린 공유 프로토콜을 사용하는지 또는 Databricks-to-Databricks 공유 프로토콜을 사용하여 데이터를 공유하는지에 따라 다릅니다. Databricks 간 공유 및 열린 공유를 참조하세요.
Databricks-to-Databricks 모델에서의 Get 액세스
Databricks-Databricks 모델에서:
데이터 공급자는 Databricks 작업 영역과 연결된 Unity Catalog 메타스토어에 대한 고유한 identifier을 찾기 위한 지침을 보내주며, 당신은 그 결과를 그들에게 다시 보내줍니다.
공유 identifier 메타스토어의 클라우드, 지역 및 UUID(메타스토어의 고유한 identifier)로 구성된 문자열로,
<cloud>:<region>:<uuid>
형식입니다. 예들 들어aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef
입니다.get을(를) Catalog 탐색기를 사용하여 공유 identifier:
Azure Databricks 작업 영역에서 Catalog클릭합니다.
Catalog 창 맨 위에서 을 클릭하고 select델타 공유.
또는 즐겨찾기 페이지에서 델타 공유> 버튼을 클릭합니다.
- 공유한 탭에서 오른쪽 위에 있는 조직의 Databricks 공유 이름을 클릭하고, 공유 복사를 selectidentifier합니다.
SQL 함수
CURRENT_METASTORE
를 사용하여 Notebook 또는 Databricks SQL 쿼리를 통해 get 공유 identifier을 수행합니다. Notebook을 사용하는 경우 공유 데이터에 액세스하는 데 사용할 작업 영역의 공유 또는 단일 사용자 클러스터에서 실행해야 합니다.SELECT CURRENT_METASTORE();
데이터 공급자는 다음을 만듭니다.
- Databricks 계정의 수신자는 사용자와 데이터에 액세스할 조직의 사용자를 나타냅니다.
- 공유은 tables, volumes및 사용자와 공유할 views를 나타냅니다.
사용자와 공유된 데이터에 액세스합니다. 사용자 또는 사용자의 팀 구성원은 필요한 경우 사용자를 위해 해당 데이터에 대한 세분화된 데이터 액세스를 구성할 수 있습니다. Databricks-to-Databricks Delta Sharing을 사용하여 공유된 데이터 읽기(recipients)를 참조하십시오.
Get 열린 공유 모델의 액세스
열린 공유 모델에서:
데이터 공급자는 다음을 만듭니다.
- Databricks 계정의 수신자는 사용자와 데이터에 액세스할 조직의 사용자를 나타냅니다. 이 구성의 일부로 토큰 및 자격 증명 파일이 생성됩니다.
- 공유- 공유될 tables 및 파티션의 표현입니다.
데이터 공급자는 보안 채널을 통해 활성화 URL을 보냅니다. 이에 따라 사용자와 공유된 데이터에 액세스할 수 있는 자격 증명 파일을 다운로드합니다.
Important
다른 사용자와 활성화 링크를 공유하지 마세요. 자격 증명 파일은 한 번만 다운로드할 수 있습니다. 자격 증명 파일이 이미 다운로드된 후 활성화 링크를 다시 방문하면 자격 증명 파일 다운로드 단추가 사용하지 않도록 설정됩니다.
사용하기 전에 활성화 링크를 분실한 경우 데이터 공급자에게 문의하세요.
자격 증명 파일을 안전한 위치에 저장합니다.
공유 데이터에 액세스해야 하는 사용자 그룹 외부의 사용자와 자격 증명 파일을 공유하지 마세요. 조직의 다른 사용자와 공유해야 하는 경우 Databricks는 암호 관리자를 사용하는 것을 권장합니다.
공유 데이터 읽기
델타 공유를 사용하여 안전하게 공유된 데이터를 읽는 방법은 자격 증명 파일(열린 공유 모델)을 받았는지 또는 Databricks 작업 영역을 사용 중인지, 데이터 공급자에게 공유 identifier(Databricks-to-Databricks 모델)를 제공했는지에 따라 달라집니다.
자격 증명 파일을 사용하여 공유 데이터 읽기(열린 공유)
델타 공유 열린 공유 프로토콜을 사용하여 데이터를 공유한 경우 다운로드한 자격 증명 파일을 사용하여 데이터 공급자의 Databricks 계정을 인증하고 공유 데이터를 읽습니다. 기본 토큰이 유효하고 공급자가 데이터를 계속 공유하는 한 액세스가 유지됩니다. Providers 토큰 만료 및 회전을 관리합니다. 데이터에 대한 업데이트는 거의 실시간으로 사용할 수 있습니다. 공유 데이터의 복사본을 읽고 만들 수 있지만 원본 데이터는 수정할 수 없습니다.
Azure Databricks, Apache Spark, pandas 및 Power BI에서 자격 증명 파일을 사용하여 공유 데이터에 액세스하고 읽는 방법을 알아보려면, 델타 공유를 통한 데이터 공유 방법(), recipients,을 참조하세요.
Databricks 간 공유를 사용하여 공유 데이터 읽기
Databricks-to-Databricks 모델을 사용하여 데이터를 공유한 경우 공유 데이터에 액세스하는 데 자격 증명 파일이 필요하지 않습니다. Databricks는 보안 연결을 관리하고 공유 데이터는 Databricks 작업 영역에서 자동으로 검색할 수 있습니다.
Databricks 작업 영역에서 해당 공유 데이터를 찾고, 읽고, 관리하는 방법에 대해 자세히 알아보려면 "Databricks-to-Databricks Delta Sharing을 사용하여 데이터 공유" (recipients)를 참조하세요.
공유 데이터 사용 감사
Azure Databricks 작업 영역에 액세스할 수 있는 경우 Azure Databricks 감사 로그를 사용하여 조직에서 델타 공유를 사용하여 데이터에 액세스하는 사용자를 이해할 수 있습니다. 데이터 공유 감사 및 모니터링을 참조하세요.
다음 단계
- Azure Databricks에 대해 자세히 알아보기
- 델타 공유에 대해 자세히 알아보기
- Unity Catalog 대해 자세히 알아보기