CLUSTER BY
cláusula (TABELA)
Aplica-se a: Databricks SQL Databricks Runtime 13.3 LTS e acima Delta Lake apenas
Define o agrupamento líquido e multidimensional para uma tabela Delta Lake.
Pode utilizar esta cláusula quando:
- Criar uma tabela usando CREATE TABLE
- Altere uma tabela com ALTER TABLE para alterar as colunas de clustering. Para agrupar linhas com colunas de clustering alteradas, você deve executar OTIMIZE. Observe que as linhas agrupadas por colunas de agrupamento anteriores não são afetadas.
As linhas atualizadas não são automaticamente reagrupadas. Execute OTIMIZE para reagrupar linhas atualizadas..
Para obter mais informações sobre clustering líquido, consulte Usar clustering líquido para tabelas Delta
Sintaxe
CLUSTER BY { ( column_name [, ...] ] ) |
NONE }
Parâmetros
-
Especifica colunas da tabela pelas quais agrupar os dados. A ordem das colunas não importa. Para se beneficiar da alteração do clustering, você deve executar OTIMIZE.
NENHUM
Desativa o agrupamento para a tabela que está sendo alterada. Os dados recém-inseridos ou atualizados não serão agrupados pelo OTIMIZE. Para não usar clustering ao criar uma tabela, omita a
CLUSTER BY
cláusula.
Exemplos
Você pode encontrar mais exemplos em Usar agrupamento líquido para tabelas Delta.
-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);
-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);
-- Recluster the table
> OPTIMIZE t;
-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;