avg
função agregar
Aplica-se a: Databricks SQL Databricks Runtime
Devolve a média calculada a partir dos valores de um grupo. Esta função é sinónimo de função agregada média.
Sintaxe
avg( [ALL | DISTINCT] expr) [FILTER ( WHERE cond ) ]
Esta função também pode ser invocada como uma função de janela usando a OVER
cláusula.
Argumentos
expr
: Uma expressão que é avaliada como numérica ou um intervalo.cond
: Uma expressão booleana opcional filtrando as linhas usadas para agregação.
Devoluções
O tipo de resultado é calculado como para os argumentos:
DECIMAL(p, s)
: O tipo de resultado é aDECIMAL(p + 4, s + 4)
. Se a precisão máxima para DECIMAL for atingida, o aumento da escala será limitado para evitar a perda de dígitos significativos.- Intervalo ano-mês: O resultado é um
INTERVAL YEAR TO MONTH
arquivo . - Intervalo de tempo do dia: O resultado é um
INTERVAL DAY TO SECOND
arquivo . - Em todos os outros casos, o resultado é um DUPLO.
Nulos dentro do grupo são ignorados. Se um grupo estiver vazio ou consistir apenas em nulos, o resultado será NULL.
Se DISTINCT
for especificado, a média é calculada após a remoção das duplicatas.
Se o resultado estourar o tipo de resultado, o Azure Databricks gerará um erro ARITHMETIC_OVERFLOW . Para retornar um NULL, use try_avg.
Aviso
No Databricks Runtime, se spark.sql.ansi.enabled for false
, um estouro retornará NULL
em vez de um erro.
Exemplos
> SELECT avg(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT avg(DISTINCT col) FROM VALUES (1), (1), (2) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5
> SELECT avg(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6
-- Overflow results in NULL for try_avg()
> SELECT try_avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
NULL
-- Overflow causes error for avg() in ANSI mode.
> SELECT avg(col) FROM VALUES (5e37::DECIMAL(38, 0)), (5e37::DECIMAL(38, 0)) AS tab(col);
Error: CANNOT_CHANGE_DECIMAL_PRECISION