共用方式為


avg 聚合函數

適用於: 核取記號為「是」Databricks SQL 核取記號為「是」Databricks Runtime

傳回從群組值計算的平均值。 此函式與平均聚合函數同義

語法

avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]

您也可以使用 子句,將此函式叫用OVER視窗函式。

引數

  • expr:評估為數值或間隔的表達式。
  • cond:選擇性布爾表示式,篩選用於匯總的數據列。

傳回

結果類型會計算為 自變數:

  • DECIMAL(p, s):結果類型為 DECIMAL(p + 4, s + 4) 。 如果達到 DECIMAL 的最大精確度,小數位數的增加將會受到限制,以避免遺失有效位數。
  • 年月間隔:結果為 INTERVAL YEAR TO MONTH
  • 時間間隔:結果是 INTERVAL DAY TO SECOND
  • 在其他所有情況下,結果都是 DOUBLE。

會忽略群組內的 Null。 如果群組是空的,或只包含 Null,則結果為 NULL。

如果 DISTINCT 指定 ,則會在移除重複項目之後計算平均值。

如果結果溢位結果類型,Azure Databricks 就會 引發ARITHMETIC_OVERFLOW 錯誤。 若要傳回 NULL,請改用 try_avg

警告

在 Databricks Runtime 中,如果 spark.sql.ansi.enabledfalse,則溢位會 NULL 傳回而不是錯誤。

範例

> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
 1-6

-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 NULL

-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 Error: CANNOT_CHANGE_DECIMAL_PRECISION