Fonction d’agrégation mean
S’applique à : Databricks SQL Databricks Runtime
Retourne la moyenne calculée à partir des valeurs d’un groupe. Cette fonction est un synonyme de la fonction d'agrégation avg.
Syntaxe
mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER
.
Arguments
expr
: Expression qui prend une valeur numérique.cond
: expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.
Retours
Le type de résultat est calculé comme pour les arguments :
DECIMAL(p, s)
: le type de résultat estDECIMAL(p + 4, s + 4)
. Si la précision maximale de DECIMAL est atteinte, l’augmentation de l’échelle est limitée pour éviter la perte de chiffres significatifs.- Intervalle d’année-mois : le résultat est
INTERVAL YEAR TO MONTH
. - intervalle de jour-heure : le résultat est
INTERVAL DAY TO SECOND
. - Dans tous les autres cas, le résultat est une valeur DOUBLE.
Les valeurs Null au sein du groupe sont ignorées. Si un groupe est vide ou comprend uniquement des valeurs Null, le résultat est NULL.
Si DISTINCT
est spécifié, la moyenne est calculée après la suppression des doublons.
Avertissement
Dans Databricks Runtime, si spark.sql.ansi.enabled a la valeur false
, un dépassement de capacité retourne NULL
au lieu d’une erreur.
Exemples
> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
1.5
> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5