뷰란?
보기는 Unity Catalog에서 하나 이상의 tables 및 views에 대한 쿼리의 결과입니다. 메타스토어에서 하나 이상의 tables 및 views로 구성된 읽기 전용 객체가 뷰입니다. 여러 스키마 및 catalogs에서 tables과 다른 views로부터 보기를 생성할 수 있습니다.
이 문서에서는 Azure Databricks에서 만들 수 있는 views 설명합니다.
Views Unity Catalog
Unity Catalog와 views은 3단계로 구성된 네임스페이스(catalog.schema.view
)의 세 번째 단계에 속합니다.
뷰에 중점을 둔
뷰는 일반적으로 메타스토어 내의 하나 이상의 데이터 원본이나 tables에 대한 쿼리 텍스트를 저장합니다. Azure Databricks에서 뷰는 schema객체로 저장된 Spark DataFrame과 동일합니다. DataFrames와 달리, 권한이 있는 경우 Azure Databricks의 어디에서나 views를 쿼리할 수 있습니다. 뷰를 만들면 데이터가 처리되거나 작성되지 않습니다. 쿼리 텍스트만 연결된 schema메타스토어에 등록됩니다.
참고 항목
Views Delta tables이외의 데이터 원본에서 지원되는 경우 실행 의미 체계가 다를 수 있습니다. Databricks는 table 또는 뷰 이름을 사용하여 데이터 원본을 참조함으로써 항상 views을 정의하도록 권장합니다. 경로 또는 URI를 지정하여 데이터 세트에 대한 views 정의하면 데이터 거버넌스 요구 사항을 혼동할 수 있습니다.
구체화된 views
구체화된 views는 정의 쿼리에서 반환된 결과를 증분 방식으로 계산하고, 그 결과를 update합니다.
Unity Catalog에서 구체화된 views을 Databricks SQL을 사용하여 등록하거나 Delta Live Tables 파이프라인의 일부로 정의할 수 있습니다.
임시 views
임시 보기는 범위 및 지속성이 제한되어 있으며 schema 또는 catalog으로 등록되지 않습니다. 임시 뷰의 수명은 사용 중인 환경에 따라 다릅니다.
- Notebook 및 작업에서 임시 views는 Notebook이나 스크립트 수준에서 범위가 지정됩니다. 선언된 Notebook 외부에서 참조할 수 없으며 Notebook이 클러스터에서 분리될 때 더 이상 존재하지 않습니다.
- Databricks SQL에서 임시 views는 쿼리 수준으로 범위가 한정됩니다. 동일한 쿼리 내의 여러 문이 임시 뷰를 사용할 수 있지만 동일한 대시보드 내에서도 다른 쿼리에서 참조할 수 없습니다.
동적 views
동적 views 사용하여 데이터 마스킹 외에도 행 및 column수준 액세스 제어를 제공할 수 있습니다. 동적 뷰 만들기를 참조하세요.
Hive 메타스토어의 Views(레거시)
모든 데이터 원본에 대해 레거시 Hive views를 정의하고 이를 레거시 Hive 메타스토어에 등록할 수 있습니다. Databricks는 모든 레거시 Hive views를 Unity Catalog로 마이그레이션할 것을 권장합니다. Hive 메타스토어의
Hive 전역 임시 보기(레거시)
글로벌 temp views는 레거시 Azure Databricks 기능으로, 컴퓨팅 리소스를 대상으로 실행되는 모든 워크로드에서 사용할 수 있는 임시 보기를 등록할 수 있게 해줍니다. 글로벌 임시 데이터 views는 Hive와 HDFS의 구식 잔재입니다. Databricks는 전역 임시 views를 사용하지 않도록 권장합니다.