sum
聚合函数
适用于: Databricks SQL Databricks Runtime
返回从组的值计算出的总和值。
语法
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
参数
expr
:一个计算结果为数字或间隔的表达式。cond
:一个可选的布尔表达式,可筛选用于聚合的行。
返回
如果 expr
是整数类型,则为 BIGINT
。
如果 expr
为 DECIMAL(p, s)
,则结果为 DECIMAL(p + min(10, 31-p), s)
。
如果 expr
是一个间隔,则结果类型与 expr
匹配。
否则为 DOUBLE
。
如果指定了 DISTINCT
,则只对唯一值求和。
如果结果溢出结果类型,则 Databricks SQL 会引发 ARITHMETIC_OVERFLOW 错误。
若要改为返回 NULL
,请使用 try_sum。
警告
在 Databricks Runtime 中,如果 spark.sql.ansi.enabled 为 false
,则 BIGINT
溢出不会导致错误,而是会将结果“换行”。
示例
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW