bitmap_or_agg
função agregar
Aplica-se a: Databricks SQL Databricks Runtime 13.3 LTS e superior
Retorna o bit a bit OR
de todos os BINARY
de entrada values no grupo.
A função é comumente usada para contar o número de números integrais distintos em combinação com as funções bitmap_bucket_number(), bitmap_count(), bitmap_bit_position()) e bitmap_construct_agg().
Para agregar bitmaps na forma de numéricos integrais, use a função de agregação bit_or().
Para agregar posições de bits em um BINARY
bitmap, use bitmap_construct_agg().
Sintaxe
bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]
Esta função também pode ser invocada como uma função window usando a cláusula OVER
.
Argumentos
-
expr
: ABINARY
de comprimento<= 4096
representando um bitmap. O Azure Databricks trunca values mais longos para 4096. -
cond
: Uma expressão booleana opcional filtrando as linhas usadas para agregação.
Devoluções
A BINARY
de comprimento 4096.
Exemplos
> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
12
-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
FROM ((SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL)
UNION ALL
(SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
GROUP BY ALL))
GROUP BY ALL);
8