bitmap_construct_agg
집계 함수
적용 대상: Databricks SQL Databricks Runtime 13.3 LTS 이상
그룹에 있는 모든 비트 위치 값의 비트 OR
값을 반환합니다. 그룹에서 0에서 32767 사이의 값을 BINARY
로 지정합니다.
이 함수는 일반적으로 bitmap_bucket_number(), bitmap_count()및 bitmap_bit_position() 함수와 함께 조밀한 고유 정수 집합의 수를 계산하는 데 사용됩니다.
정수 숫자 형식의 비트맵을 집계하려면 bit_or() 집계 함수를 사용합니다.
구문
bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]
이 함수는 OVER
절을 사용하여 창 함수로 호출할 수도 있습니다.
인수
expr
: 문자열의 비트 위치를 나타내는 0에서 32767 사이의 정수 숫자 식입니다BINARY
.cond
: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.
반품
길이 4096의 A BINARY
.
예제
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
01
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
0080
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
FROM VALUES(1), (3), (7), (15), (31) AS T(val);
8A800080
-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bitmap_bucket_number(val),
bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
5