avg
聚合函數
適用於: Databricks SQL Databricks Runtime
傳回從群組值計算的平均值。 此函式與平均聚合函數同義。
語法
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
您也可以使用 子句,將此函式叫用OVER
為視窗函式。
引數
expr
:評估為數值或間隔的表達式。cond
:選擇性布爾表示式,篩選用於匯總的數據列。
傳回
結果類型會計算為 自變數:
DECIMAL(p, s)
:結果類型為DECIMAL(p + 4, s + 4)
。 如果達到 DECIMAL 的最大精確度,小數位數的增加將會受到限制,以避免遺失有效位數。- 年月間隔:結果為
INTERVAL YEAR TO MONTH
。 - 時間間隔:結果是
INTERVAL DAY TO SECOND
。 - 在其他所有情況下,結果都是 DOUBLE。
會忽略群組內的 Null。 如果群組是空的,或只包含 Null,則結果為 NULL。
如果 DISTINCT
指定 ,則會在移除重複項目之後計算平均值。
如果結果溢位結果類型,Azure Databricks 就會 引發ARITHMETIC_OVERFLOW 錯誤。 若要傳回 NULL,請改用 try_avg。
警告
在 Databricks Runtime 中,如果 spark.sql.ansi.enabled 為 false
,則溢位會 NULL
傳回而不是錯誤。
範例
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION