Azure Databricks의 스키마란?
Unity Catalog에서 schema은 catalog의 자식이며, tables, views, volumes, 모델 및 함수를 포함할 수 있습니다. 스키마는 catalogs데이터 조직의 세분화된 범주를 제공합니다.
이 문서에서는 Unity CatalogAzure Databricks 데이터 개체 계층 구조에서 스키마의 역할을 설명합니다.
레거시 작업 영역-로컬 Hive 메타스토어의 스키마에 대한 자세한 내용은 레거시 Hive 메타스토어의 데이터베이스 개체를 참조 하세요.
schema란 무엇입니까?
Unity Catalogschema Unity Catalog의 3단계 네임스페이스(catalog.schema.table-etc
) 중 두 번째 레벨입니다.
schema 데이터 및 AI 자산을 catalogs보다 세분화된 논리적 범주로 구성합니다. 일반적으로 schema 단일 사용 사례, 프로젝트 또는 팀 샌드박스를 나타냅니다. 범주 유형에 관계없이 스키마는 데이터 액세스 제어를 관리하고 데이터 검색 가능성을 개선하는 데 유용한 도구입니다.
참고 항목
Azure Databricks에서 스키마를 데이터베이스라고도 합니다. 예를 들어 . CREATE DATABASE
CREATE SCHEMA
이 용어는 데이터베이스가 스키마 컬렉션인 일부 관계형 데이터베이스 시스템의 용어와 다릅니다.
Unity Catalog데이터 개체 계층 구조에 대한 자세한 내용은 Azure Databricks의 데이터베이스 개체란?을 참조하세요..
스키마에 대한 관리되는 위치
Unity Catalogschema대한 관리되는 스토리지 위치 지정하여 schema 모든 관리되는 tables 관리되는 volumes 데이터를 catalog 다른 스키마의 데이터와 물리적으로 격리할 수 있습니다. 이는 전적으로 선택 사항입니다. schema에 대해 관리되는 스토리지 위치를 지정하지 않으면, 데이터는 catalog의 관리되는 스토리지 위치에 상주합니다. 그리고 catalog에 대해서도 정의된 것이 없으면, 데이터는 metastore의 관리 스토리지 위치에 상주하게 됩니다. Unity에서 관리되는 스토리지 위치를 지정하는 방법을 참조하세요 Catalog.
외부 tables 및 volumes 대한 데이터 격리는 클라우드 스토리지에서 데이터를 관리하는 방법에 따라 달라집니다. schema관리되는 위치와는 독립적으로 운영됩니다.