次の方法で共有


avg 集計関数

適用対象: 「はい」のチェック マーク Databricks SQL 「はい」のチェック マーク Databricks Runtime

グループの値から計算された平均を返します。 この関数は、mean 集計関数のシノニムです。

構文

avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]

この関数は、OVER 句を使用して ウィンドウ 関数として呼び出すこともできます。

引数

  • expr: 数値または間隔に評価される式。
  • cond: 集計に使用される行をフィルター処理するブール式 (省略可能)。

戻り値

結果の型は、引数に基づいて計算されます。

  • DECIMAL(p, s): 結果の型は DECIMAL(p + 4, s + 4) です。 DECIMAL の最大有効桁数に達した場合、有効数字の損失を避けるために小数部桁数の増加が制限されます。
  • 年月間隔: 結果は INTERVAL YEAR TO MONTH です。
  • 日時間隔: 結果は INTERVAL DAY TO SECOND です。
  • それ以外の場合、結果は DOUBLE 値になります。

グループ内の null 値は無視されます。 グループが空の場合、または null 値のみで構成されている場合、結果は NULL になります。

DISTINCT を指定した場合は、重複が削除された後に平均が計算されます。

結果が結果の型をオーバーフローした場合、Azure Databricks で ARITHMETIC_OVERFLOW エラーが発生します。 代わりに NULL を返すには、try_avg を使用します。

警告

Databricks Runtime で、spark.sql.ansi.enabledfalse の場合、オーバーフローはエラーではなく、NULL を返します。

> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5

> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
 1-6

-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 NULL

-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
 Error: CANNOT_CHANGE_DECIMAL_PRECISION