bitmap_construct_agg
-Aggregatfunktion
Gilt für: Databricks SQL Databricks Runtime 13.3 LTS und höher
Gibt das bitweise OR
-Element aller Bitpositionswerte in der Gruppe zurück zwischen 0 und 32767 in einer Gruppe als BINARY
.
Die Funktion wird häufig verwendet, um die Anzahl einiger unterschiedlicher Integralzahlen in Kombination mit den Funktionen bitmap_bucket_number(), bitmap_count() und bitmap_bit_position() zu zählen.
Um Bitmaps in Form von Integralzahlen zu aggregieren, verwenden Sie die bit_or()-Aggregatfunktion.
Syntax
bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]
Diese Funktion kann auch mithilfe der OVER
-Klausel als Fensterfunktion aufgerufen werden.
Argumente
expr
: Ein integraler numerischer Ausdruck zwischen 0 und 32767, der eine Bitposition in einerBINARY
-Zeichenfolge darstellt.cond
: Ein optionaler boolescher Ausdruck, der die für die Aggregation verwendeten Zeilen filtert.
Gibt zurück
BINARY
der Länge 4096.
Beispiele
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
01
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
0080
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
FROM VALUES(1), (3), (7), (15), (31) AS T(val);
8A800080
-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bitmap_bucket_number(val),
bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
5