Condividi tramite


CLUSTER BY clausola (TABLE)

Si applica a:segno di spunta sì Solo Databricks SQL segno di spunta sì Databricks Runtime 13.3 LTS e versioni successive segno di spunta sì a Delta Lake

Definisce il clustering liquido e multidimensionale per una tabella Delta Lake.

È possibile usare questa clausola quando:

  • Creare una tabella con CREATE TABLE
  • Modificare una tabella con ALTER TABLE per modificare le colonne di clustering. Per raggruppare le righe con colonne di clustering modificate, è necessario eseguire OPTIMIZE. Si noti che le righe raggruppate dalle colonne di clustering precedenti non sono interessate.

Le righe aggiornate non vengono ri-raggruppate automaticamente. Eseguire OPTIMIZE per ri-cluster aggiornato rows..

Per altre informazioni sul clustering liquido, vedere Usare il clustering liquido per le tabelle Delta

Sintassi

CLUSTER BY { ( column_name [, ...] ] ) |
             NONE }

Parametri

  • column_name

    Specifica le colonne della tabella in base alla quale raggruppare i dati. L'ordine delle colonne non è importante. Per trarre vantaggio dalla modifica del clustering, è necessario eseguire OPTIMIZE.

  • NONE

    Disattiva il clustering per la tabella da modificare. I dati appena inseriti o aggiornati non verranno raggruppati da OPTIMIZE. Per non usare il clustering durante la creazione di una tabella, omettere la CLUSTER BY clausola .

Esempi

Per altri esempi, vedere Usare clustering liquido per le tabelle Delta.

-- Create a table with a clustering column
> CREATE TABLE t(a int, b string) CLUSTER BY (a);

-- The clustering of an existing Delta table to add a second dimension
> ALTER TABLE t CLUSTER BY (a, b);

-- Recluster the table
> OPTIMIZE t;

-- Remove the clustering
> ALTER TABLE t CLUSTER BY NONE;