sum
집계 함수
적용 대상: Databricks SQL Databricks Runtime
그룹 값에서 계산된 합계를 반환합니다.
구문
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
이 함수는 OVER
절을 사용하여 창 함수로 호출할 수도 있습니다.
인수
expr
: 숫자 또는 간격으로 평가되는 식입니다.cond
: 집계에 사용되는 행을 필터링하는 선택적 부울 식입니다.
반품
정수 형식BIGINT
인 경우 expr
.
expr
이 DECIMAL(p, s)
이면 결과는 DECIMAL(p + min(10, 31-p), s)
입니다.
expr
이 간격인 경우 결과 형식은 expr
과 일치합니다.
그렇지 않으면 .DOUBLE
DISTINCT
가 지정되면 고유한 값만 합산됩니다.
결과가 결과 형식을 오버플로하면 Databricks SQL에서 ARITHMETIC_OVERFLOW 오류가 발생합니다.
대신 반환 NULL
하려면 try_sum 사용합니다.
Warning
Databricks Runtime에서 spark.sql.ansi.enabled인 false
경우 오버플로 BIGINT
로 인해 오류가 발생하지 않고 결과를 대신 "래핑"합니다.
예제
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW