sum
集計関数
適用対象: Databricks SQL Databricks Runtime
グループの値から計算された合計を返します。
構文
sum ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
この関数は、OVER
句を使用して ウィンドウ 関数として呼び出すこともできます。
引数
expr
: 数値または間隔に評価される式。cond
: 集計に使用される行をフィルター処理するブール式 (省略可能)。
返品
expr
が整数型の場合は BIGINT
です。
expr
が DECIMAL(p, s)
の場合、結果は DECIMAL(p + min(10, 31-p), s)
です。
expr
が間隔の場合、結果の型は expr
と一致します。
それ以外の場合 DOUBLE
になります。
DISTINCT
が指定されている場合は、一意の値だけが合計されます。
結果が結果の型をオーバーフローした場合、Databricks SQL で ARITHMETIC_OVERFLOW エラーが発生します。
代わりに NULL
を返すには、try_sum を使用します。
警告
Databricks Runtime で spark.sql.ansi.enabled が false
の場合、BIGINT
のオーバーフローがエラーの原因となることはありませんが、結果がオーバーフローによって "ラップ" されます。
例
> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
30
> SELECT sum(col) FILTER(WHERE col <15)
FROM VALUES (5), (10), (15) AS tab(col);
15
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
30
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
25
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
NULL
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
NULL
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
NULL
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
Error: ARITHMETIC_OVERFLOW