bitmap_or_agg
聚合函數
適用於: Databricks SQL Databricks Runtime 13.3 LTS 和更新版本
傳回群組中所有 BINARY
輸入 values 的位元運算 OR
。
函式通常用來計算與 bitmap_bucket_number()、bitmap_count()、bitmap_bit_position()和 bitmap_construct_agg() 函式結合的相異整數數。
若要以整數數值的形式匯總位圖,請使用 bit_or() 聚合函數。
若要將位位置匯總到 BINARY
位圖中,請使用 bitmap_construct_agg()。
語法
bitmap_or_agg(expr) [FILTER ( WHERE cond ) ]
您也可以使用 OVER
子句,將此函式叫用為 window 函式。
引數
-
expr
:長度的BINARY
,<= 4096
表示位圖。 Azure Databricks 會將較長的 values 截斷為 4096 字元。 -
cond
:選擇性布爾表示式,篩選用於匯總的數據列。
傳回
BINARY
長度為 4096 的 。
範例
> SELECT hex(trim(TRAILING X'00' FROM bitmap_or_agg(val))) FROM VALUES(x'10'), (x'02') AS T(val);
12
-- Count the number of distinct values across two tables
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bucket, bitmap_count(bitmap_or_agg(num_distinct)) AS num_distinct
FROM ((SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL)
UNION ALL
(SELECT bitmap_bucket_number(val) AS bucket,
bitmap_construct_agg(bitmap_bit_position(val)) AS num_distinct
FROM VALUES(3), (1), (-1), (6), (5), (1), (5), (8) AS t(val)
GROUP BY ALL))
GROUP BY ALL);
8