Поделиться через


Агрегатная функция sum

Область применения:флажок Databricks SQL флажок Databricks Runtime

Возвращает сумму, вычисляемую из значений группы.

Синтаксис

sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Эту функцию также можно вызвать как функцию окна с помощью предложения OVER.

Аргументы

  • expr: выражение, значением которого является число или интервал.
  • cond: необязательное логическое выражение, фильтрующее строки, используемые для агрегирования.

Возвраты

Если expr это целочисленный тип числа, значение BIGINT. Если expr равно DECIMAL(p, s), то результат – DECIMAL(p + min(10, 31-p), s). Если expr — интервал, то тип результата соответствует expr.

В противном случае — DOUBLE.

Если указан DISTINCT, то суммируются только уникальные значения.

Если результат переполняет тип результата, Databricks SQL вызывает ошибку ARITHMETIC_OVERFLOW. Чтобы вернуть NULL вместо этого try_sum.

Предупреждение

В Databricks Runtime, если spark.sql.ansi.enabledfalse, переполнение BIGINT не приводит к ошибке, но "заворачивает" результат.

Примеры

> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
 30

> SELECT sum(col) FILTER(WHERE col <15)
    FROM VALUES (5), (10), (15) AS tab(col);
 15

> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
 30

> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
 25

> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
 NULL

-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 NULL

-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW

-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
  NULL

-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW