Azure Databricks のスキーマとは
Unity Catalog では、スキーマは catalog の子であり、テーブル、ビュー、ボリューム、モデル、関数を含めることができます。 スキーマは、カタログよりも詳細なカテゴリのデータ編成を提供します。
この記事では、Unity Catalog の Azure Databricks データ オブジェクト階層におけるスキーマの役割について説明します。
従来のワークスペースローカル Hive メタストアのスキーマについては、従来の Hive メタストアの Database オブジェクトに関する記事を参照してください。
スキーマとは
Unity Catalog では、スキーマは Unity Catalog の 3 レベル名前空間 (catalog.schema.table-etc
) の 2 番目のレベルです。
スキーマは、データと AI 資産を、カタログよりも詳細な論理カテゴリに整理します。 通常、スキーマは単一のユース ケース、プロジェクト、またはチーム サンドボックスを表します。 スキーマは、カテゴリの種類に関係なく、データ アクセス制御の管理とデータ検出の向上に役立つツールです。
Note
Azure Databricks では、スキーマはデータベースと呼ばれることもあります。 たとえば、CREATE DATABASE
は CREATE SCHEMA
のエイリアスです。 この用語は、データベースがスキーマのコレクションである一部のリレーショナル データベース システムとは異なります。
Unity Catalog 内のデータ オブジェクト階層の詳細については、「Azure Databricks のデータベース オブジェクトとは」を参照してください。
スキーマの管理された場所
Unity Catalog では、スキーマのマネージド ストレージの場所を指定することで、スキーマ内のすべてのマネージド テーブルとマネージド ボリュームのデータをカタログ内の他のスキーマのデータから物理的に分離できます。 これは完全に省略可能です。 スキーマのマネージド ストレージの場所を指定しない場合、データはカタログのマネージド ストレージの場所に存在します (カタログに定義されていない場合は、メタストアのマネージド ストレージの場所に存在します)。 「Unity Catalog の管理されたストレージの場所の指定」を参照してください。
外部テーブルとボリュームのデータ分離は、クラウド ストレージ内のデータの管理方法によって異なります。 スキーマの管理された場所とは無関係です。