Агрегатная функция sum
Область применения: Databricks SQL Databricks Runtime
Возвращает сумму, вычисляемую из значений группы.
Синтаксис
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Эту функцию также можно вызвать как функцию окна с помощью предложения OVER
.
Аргументы
-
expr
: выражение, значением которого является число или интервал. -
cond
: необязательное логическое выражение, фильтрующее строки, используемые для агрегирования.
Возвраты
Если expr
это целочисленный тип числа, значение BIGINT
.
Если expr
равно DECIMAL(p, s)
, то результат – DECIMAL(p + min(10, 31-p), s)
.
Если expr
— интервал, то тип результата соответствует expr
.
В противном случае — DOUBLE
.
Если указан DISTINCT
, то суммируются только уникальные значения.
Если результат переполняет тип результата, Databricks SQL вызывает ошибку ARITHMETIC_OVERFLOW.
Чтобы вернуть NULL
вместо этого try_sum.
Предупреждение
В Databricks Runtime, если spark.sql.ansi.enabledfalse
, переполнение BIGINT
не приводит к ошибке, но "заворачивает" результат.
Примеры
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW