median
statistische functie
Van toepassing op: Databricks SQL Databricks Runtime 11.3 LTS en hoger
Retourneert de mediaan die wordt berekend op basis van waarden van een groep.
Syntaxis
median ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER
component.
Argumenten
expr
: Een expressie die resulteert in een numerieke waarde of een interval.cond
: Een optionele Boole-expressie die de rijen filtert die worden gebruikt voor aggregatie.
Retouren
Hieronder wordt uitgelegd hoe de resultaattypen worden berekend:
- jaar-maandinterval: het resultaat is een
INTERVAL YEAR TO MONTH
. - dag-tijdsinterval: het resultaat is een
INTERVAL DAY TO SECOND
. - In alle andere gevallen is het resultaat een DOUBLE.
Null-waarden in de groep worden genegeerd. Als een groep leeg is of alleen uit null-waarden bestaat, is NULL
het resultaat.
Als DISTINCT
dit is opgegeven, worden duplicaten verwijderd en wordt de mediaan berekend.
Deze functie is een synoniem voor percentile_cont(0.5) WITHIN GROUP (ORDER BY expr).
Voorbeelden
> SELECT median(col) FROM VALUES (1), (2), (2), (3), (4), (NULL) AS tab(col);
2.0
> SELECT median(DISTINCT col) FROM VALUES (1), (2), (2), (3), (4), (NULL) AS tab(col);
2.5
> SELECT median(col) FROM VALUES (INTERVAL '1' YEAR), (INTERVAL '2' YEAR) AS tab(col);
1-6