mean
statistische functie
Van toepassing op: Databricks SQL Databricks Runtime
Retourneert het gemiddelde dat wordt berekend op basis van waarden van een groep. Deze functie is een synoniem voor de gemene statistische functie.
Syntaxis
mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]
Deze functie kan ook worden aangeroepen als een vensterfunctie met behulp van de OVER
component.
Argumenten
expr
: Een expressie die resulteert in een numerieke waarde.cond
: Een optionele Boole-expressie die de rijen filtert die worden gebruikt voor aggregatie.
Retouren
Het resultaattype wordt berekend op basis van de argumenten:
DECIMAL(p, s)
: Het resultaattype is eenDECIMAL(p + 4, s + 4)
. Als de maximale precisie voor DECIMAL wordt bereikt, is de toename van de schaal beperkt om verlies van significante cijfers te voorkomen.- jaar-maandinterval: het resultaat is een
INTERVAL YEAR TO MONTH
. - dag-tijdsinterval: het resultaat is een
INTERVAL DAY TO SECOND
. - In alle andere gevallen is het resultaat een DOUBLE.
Null-waarden in de groep worden genegeerd. Als een groep leeg is of alleen uit nullen bestaat, is het resultaat NULL.
Als DISTINCT
wordt opgegeven, wordt het gemiddelde berekend nadat duplicaten zijn verwijderd.
Waarschuwing
Als in Databricks Runtime spark.sql.ansi.enabled isfalse
, retourneert NULL
een overloop in plaats van een fout.
Voorbeelden
> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
2.0
> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
1.5
> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
1.5