Delta Sharing이란?
이 문서는 Azure Databricks에서의 Delta Sharing을 소개합니다. Delta Sharing은 데이터와 AI 자산을 안전하게 공유할 수 있는 플랫폼으로, 조직 외부 사용자와 Azure Databricks 사용자뿐만 아니라 Databricks를 사용하지 않는 사용자와도 데이터를 공유할 수 있습니다. 델타 공유는 데이터 제품을 교환하기 위한 공개 포럼인
또한, 델타 공유는 다른 플랫폼에서 델타 tables를 공유하는 데 사용할 수 있는 오픈 소스 프로젝트의 형태로도 사용할 수 있습니다.
참고 항목
델타 공유를 사용하여 귀하와 공유된 데이터를 액세스하는 방법을 알아보려면 델타 공유를 사용한 데이터 액세스 (for recipients)를 참조하세요.
Delta Sharing은 어떻게 작동하나요?
Delta Sharing은 사용하는 컴퓨팅 플랫폼에 관계없이 다른 조직과 안전하게 데이터를 공유하기 위해 Databricks에서 개발한 개방형 프로토콜입니다.
델타 공유를 사용하여 데이터를 공유하는 세 가지 방법이 있습니다.
Databricks-Databricks 공유 프로토콜은 Unity Catalog지원 작업 영역에서 데이터 및 AI 자산을 Unity Catalog지원 Databricks 작업 영역에 액세스할 수 있는 사용자와 공유할 수 있게 해줍니다.
이 방법은 Azure Databricks에 기본 제공되는 델타 공유 서버를 사용합니다. 다른 프로토콜에서는 지원되지 않는 일부 델타 공유 기능을 지원하며, 여기에는 노트북 공유, Unity Catalog 볼륨 공유, Unity Catalog AI 모델 공유, Unity Catalog 데이터 거버넌스, 감사 및 providers 및 recipients에 대한 사용 추적이 포함됩니다. Unity Catalog 통합하면 providers 및 recipients 모두에 대한 설정 및 거버넌스가 간소화되고 성능이 향상됩니다.
데이터를 Delta Sharing Databricks-to-Databricks 프로토콜(providers)를 사용하여 공유하는 방법을 참조하세요.
Databricks 개방형 공유 프로토콜- Unity Catalog지원 Databricks 작업 영역에서 관리하는 테이블 형식 데이터를 모든 컴퓨팅 플랫폼의 사용자와 공유할 수 있습니다.
이 방법은 Azure Databricks에 기본 제공되는 델타 공유 서버를 사용하며 Unity Catalog 사용하여 데이터를 관리하고 Databricks를 사용하지 않거나 Unity Catalog지원되는 Databricks 작업 영역에 액세스할 수 없는 사용자와 공유하려는 경우에 유용합니다. 공급자 측에서 Unity Catalog을 통합하면 providers에 대한 설정 및 거버넌스가 간소화됩니다.
Delta Sharing 오픈 공유 프로토콜(providers)을 사용하여 데이터를 공유하세요.
Databricks 여부와 관계없이 모든 플랫폼에서 모든 플랫폼으로 공유할 수 있는 오픈 소스 델타 공유 서버의 고객 관리형 구현입니다.
Azure Databricks 설명서에는 자체 델타 공유 서버 설정에 대한 지침이 포함되지 않습니다. github.com/delta-io/delta-sharing을 참조하세요.
Shares, providers및 recipients
Azure Databricks에서 델타 공유의 기본 개념은 shares, providers및 recipients.
공유란?
델타 공유에서 공유은(는) 공급자가 하나 이상의 recipients와(과) 공유하려는 tables 및 table 파티션의 읽기 전용 컬렉션입니다. 받는 사람이 Unity Catalog사용 가능한 Databricks 작업 영역을 사용하는 경우 전자 필기장 파일, views(행 및 column 수준에서 액세스를 제한하는 동적 views 포함), Unity Catalogvolumes및 Unity Catalog 모델을 공유에 포함할 수도 있습니다.
언제든지 공유에서 remove,tables, views, volumes, 모델 및 Notebook 파일을 추가할 수 있으며, 언제든지 공유에 대한 데이터 받는 사람에게 revoke 액세스를 할당할 수 있습니다.
Unity Catalog이 활성화된 Azure Databricks 작업 영역에서, 공유는 Unity Catalog에 등록된 보안 가능 개체입니다. Unity Catalog 메타스토어에서 공유를 remove하면 해당 공유의 모든 recipients가 그것에 대한 액세스 권한을 잃게 됩니다.
을 참조하여 델타 공유에 대한 shares 만들기 및 관리를 진행하세요.
공급자란?
공급자 받는 사람과 데이터를 shares 엔터티입니다. 공급자이고 기본 제공 Databricks Delta Sharing 서버를 활용하고 Unity Catalog사용하여 shares 및 recipients 관리하려는 경우 Unity Catalog사용하도록 설정된 하나 이상의 Azure Databricks 작업 영역이 필요합니다. 기존 작업 영역을 모두 Unity Catalog마이그레이션할 필요는 없습니다. 델타 공유 요구 사항에 맞게 새 Unity Catalog사용 가능한 작업 영역을 만들 수 있습니다.
받는 사람이 Unity Catalog지원 Databricks 작업 영역에 있는 경우, 공급자는 공급자 조직을 나타내며, 또한 해당 조직을 shares의 set와 연결하는 Unity Catalog 보안 개체이기도 합니다.
수신자란?
받는 엔터티는 공급자로부터 shares를 받는 주체입니다. Unity Catalog공유는 조직을 나타내며, 해당 조직이 자격 증명 또는 보안 공유 identifier을 통해 하나 이상의 shares에 액세스할 수 있도록 하는 "보안 개체"입니다.
데이터 공급자(공유자)는 지정된 Unity Catalog 메타스토어에 대해 여러 recipients 정의할 수 있지만, 여러 metastores 데이터를 특정 사용자 또는 사용자 그룹과 공유하려면 각 메타스토어에 대해 받는 사람을 별도로 정의해야 합니다. 받는 사람은 여러 shares에 액세스할 수 있습니다.
공급자가 Unity Catalog 메타스토어에서 수신자를 삭제하면, 그 수신자는 이전과 동일한 모든 shares에 대한 액세스 권한을 잃게 됩니다.
델타 공유에 대한 데이터
개방형 공유와 Databricks 간 공유의 차이점
이 섹션에서는 Unity Catalog사용하도록 설정된 Databricks 작업 영역에서 공유하기 위한 두 가지 프로토콜에 대해 설명합니다.
참고 항목
이 섹션에서는 공급자가 Unity Catalog사용 가능한 Azure Databricks 작업 영역에 있다고 가정합니다. 비 Databricks 플랫폼 또는 비 Unity Catalog 작업 영역에서 공유하도록 오픈 소스 델타 공유 서버를 설정하는 방법에 대한 자세한 내용은 github.com/delta-io/delta-sharing참조하세요.
공급자가 Azure Databricks에서 델타 공유를 사용하는 방법은 데이터를 공유하는 사용자에 따라 달라집니다.
- 개방형 공유를 사용하면 Azure Databricks에 대한 액세스 권한이 있는지 여부에 관계없이 모든 사용자와 데이터를 공유할 수 있습니다.
- Databricks-to-Databricks 공유를 사용하면 여러분의 작업 공간과 다른 Unity Catalog 메타스토어에 연결된 Azure Databricks 사용자와 데이터를 공유할 수 있습니다. Databricks-Databricks는 공개 공유에서 사용할 수 없는 Notebook, 볼륨 및 모델 공유도 지원합니다.
개방형 Delta Sharing이란?
Databricks 사용 여부에 관계없이 Azure Databricks 작업 영역 외부의 사용자와 데이터를 공유하려는 경우 개방형 Delta Sharing을 사용하여 데이터를 안전하게 공유할 수 있습니다. 데이터 공급자는 토큰을 generate 받는 사람과 안전하게 공유합니다. 그들은 토큰을 사용하여 shares에 포함된 tables에 대한 읽기 액세스를 인증하고 get에 접근할 수 있는 권한을 부여합니다.
Recipients는 다양한 컴퓨팅 도구 및 플랫폼을 사용하여 공유 데이터에 액세스할 수 있습니다.
- Azure Databricks
- Apache Spark
- Pandas
- Power BI
델타 공유 커넥터의 전체 list 사용 방법에 대한 자세한 내용은 Delta Sharing 설명서를 참조하세요.
델타 공유 오픈 공유 프로토콜(providers)을 사용하여 데이터를 공유하는 방법에 대해서는 및를 참조하세요.
Databricks 간 Delta Sharing이란?
Unity
Databricks 간 공유의 장점 중 하나는 공유 수신자가 토큰이 없어도 공유에 액세스할 수 있으며, 공급자는 수신자 토큰을 관리할 필요가 없다는 것입니다. 모든 ID 확인, 인증 및 감사를 포함한 공유 연결의 보안은 Delta Sharing 및 Databricks 플랫폼을 통해 전적으로 관리됩니다. 또 다른 장점은 Databricks Notebook 파일, views, Unity Catalogvolumes및 Unity Catalog 모델을 공유하는 기능입니다.
"또한 Delta Sharing Databricks-to-Databricks 프로토콜(providers)을 사용하여 데이터를 공유하는 것을참조하세요."
공급자 관리자는 set 델타 공유를 어떻게 설정합니까?
이 섹션에서는 providers 델타 공유를 사용하도록 설정하고 Unity Catalog사용 가능한 Azure Databricks 작업 영역에서 공유를 시작하는 방법에 대해 간략하게 설명합니다. 오픈 소스 델타 공유는 github.com/delta-io/delta-sharing을 참조하세요.
동일한 계정의 Unity Catalogmetastores 간에 Databricks-Databricks 공유는 항상 사용하도록 설정됩니다. 하지만 다른 계정의 Databricks 작업 영역이나 Databricks를 사용하지 않는 클라이언트와 Delta Sharing을 사용하여 데이터를 공유하려는 경우, Azure Databricks 계정 관리자 혹은 메타스토어 관리자는 다음과 같은 고수준의 설정 단계를 수행해야 합니다.
공유하려는 데이터를 관리하는 Unity Catalog 메타스토어에 델타 공유를 사용하도록 설정합니다.
참고 항목
델타 공유를 사용하여 계정의 다른 Unity Catalogmetastores 사용자와만 데이터를 공유하려는 경우 메타스토어에서 델타 공유를 사용하도록 설정할 필요가 없습니다. 단일 Azure Databricks 계정 내에서 메타스토어 간 공유는 기본적으로 사용하도록 설정됩니다.
메타스토어에서 Delta Sharing 사용을 참조하세요.
Unity Catalog 메타스토어에 등록된 데이터 자산을 포함하는 공유를 만듭니다.
Databricks가 아닌 받는 사람(공개 공유라고 함)과 공유하는 경우 델타 또는 Parquet 형식으로 tables 포함할 수 있습니다. Databricks-to-Databricks 공유
를 사용하려는 경우, 공유에 , Unity , Unity 모델 및 노트북 파일을 추가할 수 있습니다. Delta Sharing에 대한 shares 만들기 및 관리 참조하세요.
수신자를 만듭니다.
델타 공유에 대한 데이터 recipients 만들기 및 관리를 참조하세요.
받는 사람이 Databricks 사용자가 아니거나 Unity
사용하도록 설정된 Databricks 작업 영역에 액세스할 수 없는 경우 열려 있는 공유 사용해야 합니다. 해당 받는 사람에 대해 토큰 기반의 credentialsset이 생성됩니다. 받는 사람이 Unity Catalog사용하도록 설정된 Databricks 작업 영역에 액세스할 수 있는 경우 Databricks 간 공유를 사용할 수 있으며, 토큰 기반 credentials는 필요하지 않습니다. 받는 사람에게 공유 identifier를 요청하여 이것을 사용하여 보안 연결을 설정합니다.
팁
자신을 테스트 수신자로 사용하여 설정 프로세스를 진행해 보세요.
받는 사람이 하나 이상의 shares에 액세스할 수 있는 권한을 Grant.
델타 공유 데이터 shares(providers)에 대한 액세스 관리를 참조하십시오.
참고 항목
이 단계는 관리자가 아닌 사용자가
USE SHARE
,USE RECIPIENT
및SET SHARE PERMISSION
권한을 사용하여 수행할 수도 있습니다. 참조하세요: Unity Catalog 권한 및 보안 개체.공유에 연결하는 데 필요한 정보를 수신자에게 보냅니다(개방형 공유만 해당).
수신자에게 연결 정보 보내기를 참조하세요.
열린 공유의 경우 보안 채널을 사용하여 받는 사람에게 토큰 기반 credentials다운로드할 수 있는 활성화 링크를 보냅니다.
Databricks-Databricks 공유의 경우 공유에 포함된 데이터를 수신자의 Databricks 작업 영역에서 접근할 수 있게 됩니다. 이는 수신자에게 공유에 대한 접근 권한을 grant 하는 즉시 가능합니다.
이제 수신자는 공유 데이터에 액세스할 수 있습니다.
recipients 공유 데이터에 액세스하려면 어떻게 해야 합니까?
Recipients 읽기 전용 형식으로 공유 데이터 자산에 액세스합니다. Notebook 파일은 읽기 전용이지만, 다른 Notebook과 마찬가지로 복제 및 수정하고 수신자의 작업 영역에서 실행하는 것이 가능합니다.
보안 액세스는 공유 모델에 따라 달라집니다.
- 열린 공유(사용자가 Unity Catalog용 Databricks 작업 영역을 활성화하지 않은 경우): 사용자는 Apache Spark, pandas, Power BI, Databricks 등 다양한 선택 도구에서 데이터에 액세스할 때마다 자격 증명을 제공합니다. 델타 공유를 통해 공유된 데이터 읽기(recipients)를 참조하세요.
- Databricks 간 데이터 전송 (수신자 작업 영역은 Unity Catalog사용 설정됨): 수신자는 Databricks를 통해 데이터를 액세스합니다. Unity Catalog를 사용하여 Databricks 계정에서 다른 사용자에 대한 접근 권한을 얻거나 grant 및 deny를 사용할 수 있습니다. Databricks-to-Databricks Delta Sharing을 사용하여 공유된 데이터(recipients)를 읽기를 참조하세요.
데이터 공급자가 자신의 Databricks 계정에서 데이터 tables 또는 volumes 업데이트할 때마다 업데이트가 받는 사람의 시스템에 거의 실시간으로 표시됩니다.
공유 데이터를 공유하고 액세스하는 사용자를 어떻게 추적하나요?
Unity Catalog가 활성화된 Azure Databricks 작업 영역의 데이터 providers은 Azure Databricks 감사 로깅 및 시스템 tables를 사용하여 shares 및 recipients의 생성 및 수정을 모니터링할 수 있으며, shares의 수신 활동 또한 모니터링할 수 있습니다. 데이터 공유 감사 및 모니터링을 참조하세요.
Databricks 작업 영역에서 공유 데이터를 사용하는 데이터 recipients은 Databricks 감사 로깅 및 시스템 tables을 사용하여 누가 어떤 데이터에 액세스하고 있는지를 이해할 수 있습니다. 데이터 공유 감사 및 모니터링을 참조하세요.
공유 volumes
Databricks-to-Databricks 공유 흐름을 사용하면 volumes을 공유할 수 있습니다. 공유volumes 추가(providers) 및 Databricks-to-Databricks Delta Sharing(recipients)(recipients)를 사용하여 공유된 데이터 읽기를 참조하세요.
모델 공유
Databricks-to-Databricks 공유 흐름을 사용하여 모델을 공유할 수 있습니다. 공유 모델 추가(providers) 및 Databricks-to-Databricks Delta Sharing(recipients)(recipients)를 사용하여 공유된 데이터 읽기를 참조하세요.
Norebooks 공유
델타 공유를 사용하여 Databricks-to-Databricks 공유 흐름을 통해 Notebooks 파일을 공유할 수 있습니다.
행 및 column 수준에서 액세스 제한
받는 사람 속성에 따라 특정 table 데이터에 대한 액세스를 제한하는 동적 views 공유할 수 있습니다. 동적 보기 공유를 사용하려면 Databricks-to-Databricks 공유 흐름이 필요합니다. 행을 필터링하고 columns공유에 동적 views 추가를 참조하세요.
델타 공유 및 스트리밍
델타 공유는 Spark 구조적 스트리밍을 지원합니다. 공급자는 기록이 포함된 "table"를 공유하여 받는 사람이 지연 시간이 짧은 공유 데이터를 구조적 스트리밍 원본으로 사용하여 증분 방식으로 처리할 수 있도록 할 수 있습니다.
Azure Databricks에서 스트리밍도 참조하세요.
Delta Lake 기능 지원 매트릭스
델타 셰어링은 table을(를) 공유할 때 대부분의 Delta Lake 기능을 지원합니다. 이 지원 매트릭스는 다음을 나열합니다.
- 특정 버전의 Databricks Runtime, 오픈 소스 Delta Sharing Spark 커넥터 또는 오픈 소스 Delta Sharing Python 커넥터가 필요한 델타 기능입니다.
- 부분적으로 지원되는 기능.
기능 | 공급자 | Databricks 수신자 | 오픈 소스 수신자 |
---|---|---|---|
삭제 벡터 | 이 기능과 tables 공유는 공개 미리 보기로 제공됩니다. | - 일괄 처리 쿼리의 경우 Databricks Runtime 14.1 이상 - CDF 및 스트리밍 쿼리에 대한 Databricks Runtime 14.2 이상 |
- Delta Sharing Spark 커넥터 3.1 이상 - Delta Sharing Python 커넥터 1.1.0 이상 - Power BI v2.132.908.0 이상 |
Column 매핑 | 이 기능과 tables 공유는 공개 미리 보기로 제공됩니다. | - 일괄 처리 쿼리의 경우 Databricks Runtime 14.1 이상 - CDF 및 스트리밍 쿼리에 대한 Databricks Runtime 14.2 이상 |
- Delta Sharing Spark 커넥터 3.1 이상 - Delta Sharing Python 커넥터 1.1.0 이상 - Power BI v2.132.908.0 이상 |
균일한 형식 | 이 기능과 tables 공유는 퍼블릭 프리뷰로 제공됩니다. | - 일괄 처리 쿼리의 경우 Databricks Runtime 14.1 이상 - CDF 및 스트리밍 쿼리에 대한 Databricks Runtime 14.2 이상 |
- Delta Sharing Spark 커넥터 3.1 이상 - Delta Sharing Python 커넥터 1.1.0 이상 - Power BI v2.132.908.0 이상 |
V2 검사점 | 제한 사항으로 지원됨 | 제한 사항으로 지원됨 | 제한 사항으로 지원됨 |
TimestampNTZ | 지원 여부 | Databricks Runtime 14.1 이상 | Delta Sharing Spark 커넥터 3.3 이상 |
Liquid 클러스터링 | 제한 사항으로 지원됨 | 제한 사항으로 지원됨 | 제한 사항으로 지원됨 |
Delta Sharing FAQ
다음은 Delta Sharing에 대한 자주 묻는 질문입니다.
델타 공유를 사용하려면 Unity Catalog 필요합니까?
아니요, 공급자로서 데이터를 공유하거나 수신자로서 공유된 데이터를 사용하는 데 Unity Catalog가 필요하지 않습니다. 그러나 Unity Catalog 테이블 형식이 아닌 AI 자산 공유 지원, 기본 제공 거버넌스, 단순성 및 쿼리 성능과 같은 이점을 제공합니다.
Providers 다음 두 가지 방법으로 데이터를 공유할 수 있습니다.
Unity Catalog 관리에서 공유할 자산을 배치하고 기본 제공 Azure Databricks Delta Sharing 서버를 사용하여 공유합니다.
모든 자산을 Unity Catalog마이그레이션할 필요는 없습니다. 하나의 Unity Catalog에 대해 활성화된 Azure Databricks 작업 영역만 있으면 공유하려는 자산을 관리할 수 있습니다. 일부 계정에서는 Unity Catalog에 대해 새 작업 영역이 자동으로 사용하도록 설정됩니다. Unity의 자동 설정 사용을 참조하세요 Catalog.
Azure Databricks 계정을 사용하지 않고도 데이터를 공유할 수 있도록 오픈 Delta Sharing 서버를 구현하세요.
Recipients 두 가지 방법으로 데이터를 사용할 수 있습니다.
Databricks 작업 영역이 없는 경우 Power BI, pandas 및 오픈 소스 Apache Spark를 비롯한 많은 데이터 플랫폼에서 사용할 수 있는 오픈 소스 Delta Sharing 커넥터를 사용합니다. Delta Sharing 공개 공유(recipients) 및 Delta Sharing 오픈 소스 프로젝트를 사용하여 공유한 데이터를 읽습니다.
Azure Databricks 작업 영역에서. 받는 사람 작업 공간은 Unity Catalog에 대해 활성화할 필요는 없지만, 활성화하는 경우 거버넌스, 단순성 및 성능에서 이점이 있습니다.
이러한 이점을 원하는 수혜 조직은 모든 자산을 Unity Catalog으로 마이그레이션할 필요가 없습니다. Azure Databricks 작업 영역 중 하나만 있으면 Unity Catalog을 사용하여 공유된 자산을 관리할 수 있습니다. 일부 계정에서는 새 작업 영역이 Unity Catalog용으로 자동 활성화됩니다. Unity Catalog자동 활성화를 참조하세요.
델타 공유 열기 공유를 사용하여 공유된 데이터 읽기(recipients) 및 Databricks-to-Databricks Delta Sharing(recipients)사용하여 공유된 데이터를 읽습니다.
Delta Sharing를 사용하려면 Databricks 고객이 되어야 하나요?
아니요, Delta Sharing는 개방형 프로토콜입니다. 모든 데이터 플랫폼에서 recipients을(를) 사용하여 비 Databricks 데이터를 공유할 수 있습니다. Providers 모든 컴퓨팅 플랫폼에서 공유하도록 열린 델타 공유 서버를 구성할 수 있습니다. Recipients Power BI, pandas 및 오픈 소스 Spark를 비롯한 많은 데이터 제품에 대해 오픈 소스 델타 공유 커넥터를 사용하여 공유 데이터를 사용할 수 있습니다.
그러나 Azure Databricks에서 델타 공유를 사용하는 경우, 특히 Unity Catalog사용 가능한 작업 영역에서 공유하면 많은 이점이 있습니다.
자세한 내용은 이 FAQ의 첫 번째 질문을 참조하세요.
Delta Sharing에는 송신 비용이 발생하나요?
지역 내의 Delta Sharing에는 송신 비용이 발생하지 않습니다. 다른 데이터 공유 플랫폼과 달리 Delta Sharing에는 데이터 복제가 필요하지 않습니다. 이 모델에는 많은 장점이 있지만 이는 클라우드 또는 지역에서 데이터를 공유할 때 클라우드 공급업체가 데이터 송신 요금을 부과할 수도 있음을 의미합니다. Azure Databricks는 송신 요금이 발생하지 않는 Cloudflare R2에서의 공유를 지원하며, 송신 요금을 모니터링하고 방지하기 위한 다른 도구 및 권장 사항도 제공합니다. 델타 공유 송신 비용(providers)을 모니터링 및 관리하는 방법을참조하세요.
providers revoke 받는 사람이 접근할 수 있나요?
예, 수신자 액세스는 주문형 및 지정된 세분성 수준에서 철회할 수 있습니다. 특정 shares 및 특정 IP 주소에 대한 수신자 액세스를 deny 받는 사람에 대한 테이블 형식 데이터를 필터링하고 받는 사람 토큰을 revokerecipients 완전히 삭제할 수 있습니다.
미리 서명된 URL을 사용하는 것은 안전하지 않나요?
Delta Sharing는 미리 서명된 URL을 사용하여 개체 스토리지의 파일에 대한 임시 액세스를 제공합니다. 공유 데이터에 대한 액세스 권한이 있는 recipients에게만 오직 제공됩니다. 수명이 짧고 이미 부여된 recipients 이상의 액세스 수준을 확장하지 않기 때문에 안전합니다.
Delta Sharing 개방형 공유 프로토콜에서 사용되는 토큰은 안전한가요?
Delta Sharing를 사용하면 사용 가능한 다른 데이터 공유 플랫폼과 달리 플랫폼 간 공유를 사용할 수 있으므로 공유 프로토콜에는 개방형 토큰이 필요합니다. Providers 토큰 수명을 구성하고, 네트워킹 컨트롤을 설정하고, 요청 시 액세스를 취소하여 토큰 보안을 보장할 수 있습니다. 또한 토큰은 이미 부여된 recipients 이상으로 액세스 수준을 확장하지 않습니다. 토큰에 대한 보안 고려 사항을 참조하세요.
토큰을 사용하여 받는 사람 shares대한 액세스를 관리하지 않으려면 Databricks-to-Databricks 공유 사용하거나 Databricks 계정 팀에 연락하여 대안을 찾아야 합니다.
Delta Sharing은 보기 공유를 지원하나요?
네, Delta Sharing은 보기 공유를 지원합니다. 을(를) 참조하고 views을(를) 공유에 추가하세요.
공유 보기에 대한 계획된 향상된 기능을 알아보려면 Databricks 계정 팀에 문의하세요.
제한 사항
- 테이블 형식 데이터는 델타 table 형식. Parquet tables를 Delta로 쉽게 변환하고 다시 변환할 수 있습니다. CONVERT TO DELTA참조하세요.
- 델타 공유는 액체 클러스터링과 V2 검사점을 사용하는 tables를 지원하며, 다음과 같은 제한 사항이 있습니다.
- Recipients 스냅샷 쿼리만 실행할 수 있습니다. CDF(변경 데이터 피드) 또는 스트리밍 쿼리를 실행할 수 없습니다.
- Providers는 table을 partition 필터링으로 공유할 수 없습니다.
- 공유된 tables에서 Table 제약 조건( 기본 및 외래 키 제약 조건)을 사용할 수 없습니다.
- 공유 가능한 views은/는 델타 tables 또는 다른 공유 가능한 views에 정의되어야 합니다. 공유views 추가(providers) 및 공유 views 읽기(recipients)를 참조하세요.
- Notebook 공유는 Databricks-to-Databricks 공유에서만 지원됩니다. 노트북 파일을 공유에 추가하고 Databricks-to-Databricks Delta Sharing(recipients)을 사용하여 공유된 데이터를 읽는 방법을참조하세요.
- 볼륨 공유는 Databricks-to-Databricks 공유에서만 지원됩니다. 공유의에 volumes 추가(providers) 및 Databricks-to-Databricks Delta Sharing(recipients)을 사용하여 공유된 데이터 읽기를 참고하세요.
- 모델 공유는 Databricks-to-Databricks 공유에서만 지원됩니다. 공유에 모델 추가(providers) 및 Databricks-to-Databricks Delta Sharing을 사용한 데이터 읽기 (recipients)를 참조하세요.
- 공유 table의 메타데이터에 포함되어 허용되는 파일 수에는 제한이 있습니다. 자세한 내용은 Resource limit 초과된 오류참조하세요.
- Unity Catalog에서 schema 이름이 예약되어 있으므로
information_schema
으로 명명된 스키마는 Unity Catalog 메타스토어로 가져올 수 없습니다. -
SHALLOW CLONE
tables 공유는 델타 공유에서 지원되지 않습니다. Azure Databricks는 절대 경로를 참조하는 델타 로그에 대한 사전 서명 URL을 지원하지 않습니다.
Delta Lake 기능 지원 매트릭스도 참조하세요.
리소스 할당량
Azure Databricks는 모든 델타 공유 보안 개체에 리소스 할당량을 적용합니다. 이러한 할당량은 리소스 제한에 나열됩니다. 이러한 리소스 제한을 초과할 것으로 예상되는 경우, Azure Databricks 계정 팀에게 문의하세요.
Unity Catalog 리소스 할당량 API를 사용하여 할당량 사용량을 모니터링할 수 있습니다. Unity Catalog 리소스 할당량사용 모니터링을 참조하세요.