Fonction d’agrégation median
S’applique à : Databricks SQL Databricks Runtime 11.3 LTS et versions ultérieures
Retourne la valeur médiane calculée à partir des valeurs d’un groupe.
Syntaxe
median ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Cette fonction peut également être appelée en tant que fonction de fenêtre à l’aide de la clause OVER
.
Arguments
expr
: expression qui prend une valeur numérique ou intervalle (INTERVAL).cond
: expression booléenne facultative qui filtre les lignes utilisées pour l’agrégation.
Retours
Voici comment les types de résultats sont calculés :
- Intervalle d’année-mois : le résultat est
INTERVAL YEAR TO MONTH
. - intervalle de jour-heure : le résultat est
INTERVAL DAY TO SECOND
. - Dans tous les autres cas, le résultat est une valeur DOUBLE.
Les valeurs Null au sein du groupe sont ignorées. Si un groupe est vide ou comprend uniquement des valeurs Null, le résultat est NULL
.
Si DISTINCT
est spécifié, les doublons sont supprimés et la médiane est calculée.
Cette fonction est un synonyme de percentile_cont(0.5) WITHIN GROUP (ORDER BY expr).
Exemples
> SELECT median(col) FROM VALUES (1), (2), (2), (3), (4), (NULL) AS tab(col);
2.0
> SELECT median(DISTINCT col) FROM VALUES (1), (2), (2), (3), (4), (NULL) AS tab(col);
2.5
> SELECT median(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6