Fonctions intégrées
S’applique à : Databricks SQL Databricks Runtime
Cet article présente des liens vers des opérateurs intégrés et leurs descriptions, et des fonctions pour les types chaînes et binaires, scalaires numériques, agrégations, fenêtres, tableaux , mappages, dates et timestamps, cast, données CSV, données JSON, manipulation XPath et d’autres fonctions diverses.
Pour les cas d’usage qui ne sont pas pris en charge par les fonctions intégrées existantes, envisagez de définir une fonction personnalisée. Consultez Que sont les fonctions définies par l’utilisateur (UDF) ?.
Voir aussi :
Opérateurs et prédicats
Pour plus d’informations sur la façon dont les opérateurs sont analysés les uns par rapport aux autres, consultez Priorité des opérateurs.
Opérateur | Syntaxe | Description |
---|---|---|
& | expr1 & expr2 |
Retourne l’opération au niveau du bit AND de expr1 et expr2 . |
and | expr1 and expr2 |
Retourne le AND logique de expr1 et expr2 . |
* | multiplier * multiplicand |
Retourne multiplier multiplié par multiplicand . |
!= | expr1 != expr2 |
Retourne la valeur true si expr1 n’est pas égal à expr2 , sinon false . |
! | !expr |
Retourne le NOT logique d’une expression booléenne. |
between | expr1 [not] between expr2 and expr2 |
Vérifie si la valeur de expr1 est supérieure ou égale à celle de expr2 et inférieure ou égale à celle de expr3 . |
[ ] | arrayExpr [ indexExpr ] |
Retourne le indexExpr ème élément de ARRAY arrayExpr . |
[ ] | mapExpr [ keyExpr ] |
Retourne une valeur à keyExpr de MAP mapExpr . |
^ | expr1 ^ expr2 |
Retourne l’opération au niveau du bit OR (XOR) de expr1 et expr2 . |
: | jsonStr : jsonPath |
Retourne les champs extraits du jsonStr . |
:: | expr :: type |
Caste la valeur expr vers le type de données cible type . |
?:: | expr ?:: type |
Convertit la valeur expr en type de données cible type si possible, retourne NULL dans le cas contraire. |
div | dividend div divisor |
Retourne la partie entière de la division de dividend par divisor . |
. | mapExpr . keyIdentifier |
Renvoie une valeur MAP par keyIdentifier . |
. | structExpr . fieldIdentifier |
Retourne un champ STRUCT par fieldIdentifier . |
== | expr1 == expr2 |
Retourne true si expr1 est égal à expr2 , sinon false . |
= | expr1 = expr2 |
Retourne true si expr1 est égal à expr2 , sinon false . |
>= | expr1 >= expr2 |
Retourne true si la valeur de expr1 est supérieure ou égale à celle de expr2 , sinon false . |
> | expr1 > expr2 |
Retourne true si la valeur de expr1 est supérieure à celle de expr2 , sinon false . |
exists | exists(query) |
Retourne la valeur true si query retourne au moins une ligne, sinon false. |
ilike | str [not] ilike (pattern[ESCAPE escape]) |
Retourne true si str (ne) correspond (pas) à pattern avec escape sans respect de la casse. |
ilike | str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) |
Retourne true si str (ne) correspond (pas) à tout ou partie des modèles sans respect de la casse. |
in | elem [not] in (expr1[, ...]) |
Retourne true si elem est égal (n’est pas égal) à un exprN . |
in | elem [not] in (query) |
Retourne true si elem est égal (n’est pas égal) à une ligne dans query . |
is distinct | expr1 is [not] distinct from expr2 |
Vérifie si les arguments ont (n’ont pas) des valeurs différentes pour lesquelles les valeurs NULL sont considérées comme des valeurs comparables. |
is false | expr is [not] false |
Vérifie si expr est (n’est pas) false . |
is null | expr is [not] null |
Retourne true si expr n’a pas la valeur NULL . |
is true | expr is [not] true |
Vérifie si expr est (n’est pas) true . |
like | str [not] like (pattern[ESCAPE escape]) |
Retourne true si str (ne) correspond (pas) à pattern avec escape . |
like | str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) |
Retourne true si str (ne) correspond (pas) à tout ou partie des modèles. |
<=> | expr1 <=> expr2 |
Retourne le même résultat que EQUAL(=) pour les opérandes non Null, mais true si les deux sont NULL et false si l’un d’eux est NULL . |
<= | expr1 <= expr2 |
Retourne true si expr1 est inférieur ou égal à expr2 , sinon false . |
<> | expr1 <> expr2 |
Retourne true si expr1 n’est pas égal à expr2 , false sinon. |
< | expr1 < expr2 |
Renvoie true si expr1 est inférieur expr2 , ou false sinon. |
- | expr1 - expr2 |
Retourne la soustraction de expr2 à partir de expr1 . |
not | not expr |
Retourne le NOT logique d’une expression booléenne. |
or | expr1 or expr2 |
Retourne le OR logique de expr1 et expr2 . |
% | dividend % divisor |
Retourne le reste après dividend / divisor . |
|| | expr1 \|\| expr2 |
Retourne la concaténation de expr1 et de expr2 . |
| | expr1 \| expr2 |
Retourne l’opération au niveau du bit OR de expr1 et expr2 . |
+ | expr1 + expr2 |
Retourne la somme des valeurs expr1 et expr2 . |
regexp | str [not] regexp regex |
Retourne true si str (ne) correspond (pas) à regex . |
regexp_like | str [not] regexp_like regex |
Retourne true si str (ne) correspond (pas) à regex . |
rlike | str [not] rlike regex |
Retourne true si str (ne) correspond (pas) à regex . |
/ | dividend / divisor |
Retourne dividend divisé par divisor . |
~ | ~ expr |
Retourne l’opération au niveau du bit NOT de expr . |
Précédence des opérateurs
Priorité | Opérateur |
---|---|
1 | : , , :: ?:: , ,[ ] |
2 | - (unaire), + (unaire), ~ |
3 | * , , / % , ,div |
4 | + , , - \|\| |
5 | & |
6 | ^ |
7 | \| |
8 | = , == , , <> <=> , != , < , <= , > ,>= |
9 | not , exists |
10 | between , in , , regexp rlike , ilike , like , , is [not] [NULL, true, false] ,is [not] distinct from |
11 | and |
12 | or |
Fonctions de chaînes et binaires
Fonction | Description |
---|---|
expr1 || expr2 | Retourne la concaténation de expr1 et de expr2 . |
aes_decrypt(expr, key[, mode[, padding[, aad]]]) | Déchiffre un binaire expr avec le chiffrement AES. |
aes_encrypt(expr, key[, mode[, padding[, iv[, aad]]]]) | Chiffre un binaire expr avec le chiffrement AES. |
ascii(str) | Retourne le point de code ASCII du premier caractère de str . |
base64(expr) | Convertit expr en une chaîne base 64. |
bin(expr) | Retourne la représentation binaire de expr . |
binary(expr) | Caste la valeur de expr sur BINARY . |
bit_length(expr) | Retourne la longueur en bits de données de type chaîne ou le nombre de bits de données binaires. |
bitmap_count(expr) | Renvoie le nombre de bits définis dans une chaîne BINARY représentant un bitmap. |
btrim(str [, trimStr]) | Retourne str en supprimant les caractères de début et de fin. |
char(expr) | Retourne le caractère au point de code UTF-16 fourni. |
char_length(expr) | Retourne la longueur en nombre de caractères de données de type chaîne, ou en nombre d’octets de données binaires. |
character_length(expr) | Retourne la longueur en nombre de caractères de données de type chaîne, ou en nombre d’octets de données binaires. |
charindex(substr, str[, pos]) | Retourne la position de la première occurrence de substr dans str après la position pos . |
chr(expr) | Retourne le caractère au point de code UTF-16 fourni. |
concat(expr1, expr2[, …]) | Retourne la concaténation des arguments. |
concat_ws(sep[, expr1[, …]]) | Retourne les chaînes de concaténation séparées par sep . |
contains(expr, subExpr) | Retourne true si expr STRING ou BINARY contient subExpr . |
crc32(expr) | Retourne une valeur de vérification de redondance cyclique de expr . |
decode(expr, charSet) | Traduit le expr binaire en chaîne à l’aide du codage du jeu de caractères charSet . |
encode(expr, charSet) | Retourne la représentation binaire d’une chaîne à l’aide du codage de caractères charSet . |
endswith(expr, endExpr) | Retourne true si expr STRING ou BINARY se termine par endExpr . |
find_in_set(searchExpr, sourceExpr) | Retourne la position d’une chaîne au sein d’une liste de chaînes séparées par des virgules. |
format_number(expr, scale) | Met en forme expr comme #,###,###.## , arrondi à scale décimales. |
format_number(expr, fmt) | Met en forme expr comme fmt . |
format_string(strfmt[, obj1 [, …]]) | Retourne une chaîne mise en forme à partir de chaînes au format printf-style. |
hex(expr) | Convertit expr au format hexadécimal. |
str ilike (pattern[ESCAPE escape]) | Retourne la valeur true si str correspond à pattern avec escape sans respect de la casse. |
initcap(expr) | Retourne expr avec la première lettre de chaque mot en majuscules. |
instr(str, substr) | Retourne l’index (base 1) de la première occurrence de substr dans str . |
lcase(expr) | Retourne expr avec tous les caractères convertis en minuscules. |
left(str, len) | Retourne les len caractères les plus à gauche dans str . |
len(expr) | Retourne la longueur en nombre de caractères de données de type chaîne, ou en nombre d’octets de données binaires. |
length(expr) | Retourne la longueur en nombre de caractères de données de type chaîne, ou en nombre d’octets de données binaires. |
levenshtein(str1, str2) | Retourne la distance Levenshtein entre les chaînes str1 et str2 . |
str like (pattern[ESCAPE escape]) | Retourne la valeur true si str correspond à pattern avec escape . |
locate(substr, str[, pos]) | Retourne la position de la première occurrence de substr dans str après la position pos . |
lower(expr) | Retourne expr avec tous les caractères convertis en minuscules. |
lpad(expr, len[, pad]) | Retourne expr , complété à gauche avec pad jusqu’à la longueur len . |
ltrim([trimstr,] str) | Retourne str en supprimant les caractères de début dans trimStr . |
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) | Retourne une version masquée de l’entrée str . |
md5(expr) | Retourne une somme de contrôle MD5 128 bits de expr sous forme de chaîne hexadécimale. |
octet_length(expr) | Retourne la longueur en octets des données de chaîne ou le nombre d’octets de données binaires. |
overlay(input PLACING replace FROM pos [FOR len]) | Remplace input par replace qui commence à pos et dont la longueur est égale à len . |
parse_url(url, partToExtract[, key]) | Extrait une partie de url . |
position(substr, str[, pos]) | Retourne la position de la première occurrence de substr dans str après la position pos . |
position(subtr IN str) | Retourne la position de la première occurrence de substr dans str après la position pos . |
printf(strfmt[, obj1 [, …]]) | Retourne une chaîne mise en forme à partir de chaînes au format printf-style. |
str regexp regex | Retourne la valeur true si str correspond à regex . |
str regexp_like regex | Retourne la valeur true si str correspond à regex . |
regexp_count(str, regexp) | Retourne le nombre de fois où str correspond au modèle regexp . |
regexp_extract(str, regexp[, idx]) | Extrait la première chaîne dans str qui correspond à l’expression regexp et à l’index de groupe regex . |
regexp_extract_all(str, regexp[, idx]) | Extrait toutes les chaînes dans str qui correspondent à l’expression regexp et correspond à l’index de groupe regex . |
regexp_instr(str, regexp) | Retourne la position de la première sous-chaîne de str qui correspond à regexp . |
regexp_replace(str, regexp, rep[, position]) | Remplace toutes les sous-chaînes de str qui correspondent à regexp par rep . |
regexp_substr(str, regexp) | Retourne la première sous-chaîne de str qui correspond à regexp . |
repeat(expr, n) | Retourne la chaîne qui répète expr n fois. |
replace(str, search [, replace]) | Remplace toutes les occurrences de search par replace . |
reverse(expr) | Retourne une chaîne inversée ou un tableau avec l’ordre inverse des éléments. |
right(str, len) | Retourne les len caractères les plus à droite de la chaîne str . |
str rlike regex | Retourne la valeur true si str correspond à regex . |
rpad(expr, len[, pad]) | Retourne expr , complété à droite avec pad jusqu’à une longueur de len . |
rtrim([trimStr,] str) | Retourne str en supprimant les caractères de fin. |
sentences(str[, lang, country]) | Fractionne str en un tableau de mots. |
sha(expr) | Retourne une valeur de hachage sha1 sous la forme d’une chaîne hexadécimale de expr . |
sha1(expr) | Retourne une valeur de hachage sha1 sous la forme d’une chaîne hexadécimale de expr . |
sha2(expr, bitLength) | Retourne une somme de contrôle de la famille SHA-2 sous la forme d’une chaîne hexadécimale de expr . |
soundex(expr) | Retourne le code soundex de la chaîne. |
space(n) | Retourne une chaîne comprenant n espaces. |
split(str, regex[, limit]) | Fractionne str autour d’occurrences correspondant à regex , et retourne un tableau d’une longueur maximale de limit . |
split_part(str, delim, partNum) | Fractionne str autour des occurrences de delim et retourne la partie partNum . |
startswith(expr, startExpr) | Retourne true si expr STRING ou BINARY commence par startExpr . |
string(expr) | Caste la valeur expr sur STRING . |
substr(expr, pos[, len]) | Retourne la sous-chaîne de expr qui commence à pos et dont la longueur est égale à len . |
substr(expr FROM pos[ FOR len]) | Retourne la sous-chaîne de expr qui commence à pos et dont la longueur est égale à len . |
substring(expr, pos[, len]) | Retourne la sous-chaîne de expr qui commence à pos et dont la longueur est égale à len . |
substring(expr FROM pos[ FOR len]) | Retourne la sous-chaîne de expr qui commence à pos et dont la longueur est égale à len . |
substring_index(expr, delim, count) | Retourne la sous-chaîne de expr située avant count occurrences du délimiteur delim . |
to_binary(expr[, fmt]) | Retourne expr casté en BINARY en fonction de fmt . |
to_char(numExpr, fmt) | Retourne numExpr casté en STRING en utilisant la mise en forme fmt ». |
to_varchar(numExpr, fmt) | Retourne numExpr casté en STRING en utilisant la mise en forme fmt ». |
translate(expr, from, to) | Retourne une expr où tous les caractères figurant dans from ont été remplacés par ceux figurant dans to . |
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) | Découpe des caractères d’une chaîne. |
try_aes_decrypt(expr, key[, mode[, padding[, aad]]]) | Déchiffre un fichier binaire expr à l’aide du chiffrement AES et retourne NULL en cas d’erreur. |
try_to_binary(expr [, fmt]) | Retourne expr casté en BINARY sur la base de fmt , ou NULL si l’entrée n’est pas valide. |
try_url_decode(str) | Traduit une chaîne à partir du format application/x-www-form-urlencoded, et retourne NULL en cas d’erreur. |
try_zstd_decompress(value) | Retourne une valeur décompressée avec la compression Zstandard ou NULL si l’entrée n’est pas valide. |
ucase(expr) | Retourne expr avec tous les caractères convertis en majuscules. |
unbase64(expr) | Retourne une chaîne base64 décodée au format binaire. |
unhex(expr) | Convertit une expr hexadécimale en BINARY . |
upper(expr) | Retourne expr avec tous les caractères convertis en majuscules. |
url_decode(str) | Traduit une chaîne à partir du format application/x-www-form-urlencoded. |
url_encode(str) | Traduit une chaîne au format application/x-www-form-urlencoded. |
zstd_compress (value[,level[,streaming_mode]]) | Retourne la valeur décompressée avec la compression Zstandard. |
zstd_decompress(value) | Retourne la valeur décompressée avec la compression Zstandard. |
Fonctions scalaires numériques
Fonction | Description |
---|---|
~ expr | Retourne le NOT au niveau du bit d’expr . |
dividend / divisor | Retourne dividend divisé par divisor . |
expr1 | expr2 | Retourne l’opération au niveau du bit OR de expr1 et expr2 . |
- expr | Retourne la valeur négative de expr . |
expr1 - expr2 | Retourne la soustraction de expr2 à partir de expr1 . |
+ expr | Retourne la valeur de expr . |
expr1 + expr2 | Retourne la somme des valeurs expr1 et expr2 . |
dividend % divisor | Retourne le reste après dividend / divisor . |
expr1 ^ expr2 | Retourne l’opération au niveau du bit OR (XOR) de expr1 et expr2 . |
expr1 & expr2 | Retourne l’opération au niveau du bit AND de expr1 et expr2 . |
multiplier * multiplicand | Retourne multiplier multiplié par multiplicand . |
abs(expr) | Retourne la valeur absolue de la valeur numérique dans expr . |
acos(expr) | Retourne le cosinus inverse (arc cosinus) de expr . |
acosh(expr) | Retourne le cosinus hyperbolique inverse de expr . |
asin(expr) | Retourne le sinus inverse (arc sinus) de expr . |
asinh(expr) | Retourne le sinus hyperbolique inverse de expr . |
atan(expr) | Retourne la tangente inverse (arc tangente) de expr . |
atan2(exprY, exprX) | Retourne l’angle (en radians) entre l’axe X positif d’un plan et le point donné par les coordonnées (exprX , exprY ). |
atanh(expr) | Retourne la tangente hyperbolique inverse de expr . |
bigint(expr) | Caste la valeur expr sur BIGINT . |
bit_count(expr) | Retourne le nombre de bits définis dans l’argument. |
bit_get(expr, pos) | Retourne la valeur d’un bit dans une représentation binaire d’un numérique intégral. |
bit_reverse(expr) | Retourne la valeur obtenue en inversant l’ordre des bits dans l’argument. |
bitmap_bit_position(expr) | Renvoie la position du bit de base 0 d'un nombre BIGINT donné dans un compartiment. |
bitmap_bucket_number(expr) | Retourne le numéro de compartiment bitmap pour un nombre BIGINT donné. |
bround(expr[,targetScale]) | Retourne l’arrondi de expr à l’aide du mode d’arrondi HALF_EVEN . |
cbrt(expr) | Retourne la racine cubique de expr . |
ceil(expr[,targetScale]) | Retourne le plus petit nombre non inférieur à expr arrondi à targetScale chiffres après la virgule à l’unité supérieure. |
ceiling(expr[,targetScale]) | Retourne le plus petit nombre non inférieur à expr arrondi à targetScale chiffres après la virgule à l’unité supérieure. |
conv(num, fromBase, toBase) | Convertit num de fromBase en toBase . |
convert_timezone([sourceTz, ]targetTz, sourceTs) | Convertit le TIMESTAMP_NTZ sourceTs du fuseau horaire sourceTz en targetTz . |
cos(expr) | Retourne le cosinus de expr . |
cosh(expr) | Retourne le cosinus hyperbolique de expr . |
cot(expr) | Retourne la cotangente de expr . |
csc(expr) | Retourne la cosécante de expr . |
decimal(expr) | Caste la valeur expr sur DECIMAL . |
degrees(expr) | Convertit les radians en degrés. |
divisor div dividend | Retourne la partie entière de la division de divisor par dividend . |
double(expr) | Caste la valeur expr sur DOUBLE . |
e() | Retourne la constante e . |
exp(expr) | Retourne e à la puissance expr . |
expm1(expr) | Retourne exp(expr) - 1 . |
factorial(expr) | Retourne la factorielle de expr . |
float(expr) | Caste la valeur expr sur FLOAT . |
floor(expr[,targetScale]) | Retourne le plus grand nombre non inférieur à expr arrondi à targetScale chiffres après la virgule à l’unité inférieure. |
getbit(expr, pos) | Retourne la valeur d’un bit dans une représentation binaire d’un numérique intégral. |
hypot(expr1, expr2) | Retourne sqrt(expr1 * expr1 + expr2 * expr2) . |
int(expr) | Caste la valeur expr sur INTEGER . |
isnan(expr) | Retourne la valeur true si expr a la valeur NaN . |
ln(expr) | Retourne le logarithme naturel (base e ) de expr . |
log([base,] expr) | Retourne le logarithme de expr avec base . |
log1p(expr) | Retourne log(1 + expr) . |
log2(expr) | Retourne le logarithme de expr avec la base 2 . |
log10(expr) | Retourne le logarithme de expr avec la base 10 . |
mod(dividend, divisor) | Retourne le reste après dividend / divisor . |
nanvl(expr1, expr2) | Retourne expr1 si ce n'est pas NaN , sinon expr2 . |
negative(expr) | Retourne la valeur négative de expr . |
'nullifzero(expr)' | Retourne expr s’il n’est pas égal à zéro, ou NULL sinon. |
pi() | Retourne pi. |
pmod(dividend, divisor) | Retourne le reste positif après dividend / divisor . |
positive(expr) | Retourne la valeur de expr . |
pow(expr1, expr2) | Élève expr1 à la puissance expr2 . |
power(expr1, expr2) | Élève expr1 à la puissance expr2 . |
radians(expr) | Convertit expr , exprimée en degrés, en radians. |
rand([seed]) | Retourne une valeur aléatoire comprise entre 0 et 1. |
randn([seed]) | Retourne une valeur aléatoire à partir d’une distribution normale standard. |
random([seed]) | Retourne une valeur aléatoire comprise entre 0 et 1. |
rint(expr) | Retourne expr arrondi à un nombre entier sous la forme d’un DOUBLE . |
round(expr[,targetScale]) | Retourne l’arrondi de expr à l’aide du mode d’arrondi HALF_UP . |
sec(expr) | Retourne la sécante de expr . |
shiftleft(expr, n) | Retourne une valeur au niveau du bit décalée vers la gauche de n bits. |
shiftright(expr, n) | Retourne un nombre intégral signé au niveau du bit décalé vers la droite de n bits. |
shiftrightunsigned(expr, n) | Retourne un nombre intégral signé non signé au niveau du bit décalé vers la droite de n bits. |
sign(expr) | Retourne -1.0, 0.0 ou 1.0 si expr est négatif, égal à 0 ou positif. |
signum(expr) | Retourne -1.0, 0.0 ou 1.0 si expr est négatif, égal à 0 ou positif. |
sin(expr) | Retourne le sinus de expr . |
sinh(expr) | Retourne le sinus hyperbolique de expr . |
smallint(expr) | Caste la valeur expr sur SMALLINT . |
sqrt(expr) | Retourne la racine carrée du nombre expr . |
tan(expr) | Retourne la tangente de expr . |
tanh(expr) | Retourne la tangente hyperbolique de expr . |
tinyint(expr) | Caste expr sur TINYINT . |
to_number(expr, fmt) | Retourne expr casté en DECIMAL avec la mise en forme fmt . |
try_add(expr1, expr2) | Retourne la somme de expr1 et expr2 , ou NULL en cas d’erreur. |
try_divide(dividend, divisor) | Retourne dividend divisé par divisor , ou NULL si divisor est égal à 0. |
try_mod(dividend, divisor) | Retourne le reste après dividend / divisor , ou NULL si divisor est égal à 0. |
try_multiply(multiplier, multiplicand) | Retourne multiplier multiplié par multiplicand , ou NULL en cas de dépassement. |
try_subtract(expr1, expr2) | Retourne la soustraction de expr2 à expr1 , ou NULL en cas de dépassement. |
try_to_number(expr, fmt ) | Retourne expr casté en DECIMAL à l’aide de la mise en forme fmt , ou NULL si expr ne correspond pas au format. |
width_bucket(expr, minExpr, maxExpr, numBuckets) | Retourne le numéro de compartiment pour une valeur dans un histogramme equi-width. |
'zeroifnull(expr)' | Retourne expr si ce n’est pas NULL le cas, ou 0 sinon. |
Fonctions d’agrégation
Fonction | Description |
---|---|
any(expr) | Retourne la valeur true si au moins une des valeurs de expr dans le groupe est true. |
any_value(expr[,ignoreNull]) | Retourne la première valeur de expr pour un groupe de lignes. |
approx_count_distinct(expr[,relativeSD]) | Retourne le nombre estimé de valeurs distinctes dans expr au sein du groupe. |
approx_percentile(expr,percentage[,accuracy]) | Retourne le centile approximatif de expr au sein du groupe. |
approx_top_k(expr[,k[,maxItemsTracked]]) | Retourne les k valeurs d’élément les plus fréquentes dans un expr avec leurs nombres approximatifs. |
array_agg(expr) | Retourne un tableau composé de toutes les valeurs d’expr dans le groupe. |
avg(expr) | Retourne la moyenne calculée à partir des valeurs d’un groupe. |
bit_and(expr) | Retourne l’opération au niveau du bit AND de toutes les valeurs d’entrée dans le groupe. |
bit_or(expr) | Retourne l’opération au niveau du bit OR de toutes les valeurs d’entrée dans le groupe. |
bit_xor(expr) | Retourne l’opération au niveau du bit XOR de toutes les valeurs d’entrée dans le groupe. |
bitmap_construct_agg(expr) | Renvoie le OR au niveau du bit de toutes les valeurs de positions de bits dans le groupe. entre 0 et 32767 dans un groupe sous forme de BINARY . |
bitmap_or_agg(expr) | Renvoie le bit à bit OR de toutes les valeurs d’entrée BINARY du groupe. |
bool_and(expr) | Retourne la valeur true si toutes les valeurs de expr sont vraies au sein du groupe. |
bool_or(expr) | Retourne la valeur true si au moins une valeur dans expr est true au sein du groupe. |
collect_list(expr) | Retourne un tableau composé de toutes les valeurs d’expr dans le groupe. |
collect_set(expr) | Retourne un tableau contenant toutes les valeurs uniques figurant dans expr au sein du groupe. |
corr(expr1,expr2) | Retourne un coefficient de corrélation de Pearson entre un groupe de paires de nombres. |
count(*) | Retourne le nombre total de lignes récupérées dans un groupe, y compris celles contenant la valeur null. |
count(expr[, …]) | Retourne le nombre de lignes dans un groupe pour lesquelles les expressions fournies sont toutes non null. |
count_if(expr) | Retourne le nombre de valeurs true pour le groupe dans expr . |
count_min_sketch(column,epsilon,confidence,seed) | Retourne la valeur count_min sketch de toutes les valeurs du groupe dans column avec epsilon , confidence et seed . |
covar_pop(expr1,expr2) | Retourne la covariance de population de paires de nombres dans un groupe. |
covar_samp(expr1,expr2) | Retourne la covariance d’échantillon de paires de nombres dans un groupe. |
every(expr) | Retourne la valeur true si toutes les valeurs de expr dans le groupe ont la valeur true. |
first(expr[,ignoreNull]) | Retourne la première valeur de expr pour un groupe de lignes. |
first_value(expr[,ignoreNull]) | Retourne la première valeur de expr pour un groupe de lignes. |
histogram_numeric(expr,numBins) | Calcule un histogramme sur expr avec numBins bacs, en retournant un tableau de paires représentant les centres des bacs. |
hll_sketch_agg(expr[,lgConfigK]) | Retourne un croquis HyperLogLog utilisé pour estimer un nombre de valeurs distinctes. |
hll_union_agg(expr[,allowDifferentLgConfigK]) | Agrège les croquis HyperLogLog pour un groupe de lignes. |
kurtosis(expr) | Retourne la valeur kurtosis calculée à partir des valeurs d’un groupe. |
last(expr[,ignoreNull]) | Renvoie la dernière valeur de expr pour le groupe de lignes. |
last_value(expr[,ignoreNull]) | Renvoie la dernière valeur de expr pour le groupe de lignes. |
max(expr) | Retourne la valeur maximale de expr dans un groupe. |
max_by(expr1,expr2) | Retourne la valeur d’expr1 associée à la valeur maximale d’expr2 dans un groupe. |
mean(expr) | Retourne la moyenne calculée à partir des valeurs d’un groupe. |
median(expr) | Retourne la valeur médiane calculée à partir des valeurs d’un groupe. |
min(expr) | Retourne la valeur minimale de expr dans un groupe. |
min_by(expr1, expr2) | Retourne la valeur d’expr1 associée à la valeur minimale d’expr2 dans un groupe. |
mode(expr [,déterministe]) | Retourne la valeur la plus fréquente de expr , autre que NULL , dans un groupe. |
percentile(expr, percentage [,frequency]) | Retourne la valeur de percentile exacte de expr au percentage spécifié. |
percentile_approx(expr,percentage[,accuracy]) | Retourne le centile approximatif de expr au sein du groupe. |
percentile_cont(pct) WITHIN GROUP (ORDER BY key) | Retourne le centile interpolé de key au sein du groupe. |
percentile_disc(pct) WITHIN GROUP (ORDER BY key) | Retourne le centile discret de key au sein du groupe. |
regr_avgx(yExpr, xExpr) | Retourne la moyenne de xExpr calculée à partir des valeurs d’un groupe où xExpr et yExpr sont NOT NULL . |
regr_avgy(yExpr, xExpr) | Retourne la moyenne de yExpr calculée à partir des valeurs d’un groupe où xExpr et yExpr sont NOT NULL . |
regr_count(yExpr, xExpr) | Retourne le nombre de paires de valeurs non-Null yExpr , xExpr dans le groupe. |
regr_intercept(yExpr, xExpr) | Retourne l’ordonnée à l’origine de la ligne de régression linéaire univariée dans un groupe où xExpr et yExpr ne sont PAS NULL. |
regr_r2(yExpr, xExpr) | Retourne le coefficient de détermination à partir des valeurs d’un groupe où xExpr et yExpr ne sont PAS NULL. |
regr_slope(yExpr, xExpr) | Retourne la pente de la ligne de régression linéaire des paires de valeurs non-Null yExpr , xExpr dans le groupe. |
regr_sxx(yExpr, xExpr) | Retourne la somme des carrés des valeurs xExpr d’un groupe où xExpr et yExpr ne sont PAS NULL. |
regr_sxy(yExpr, xExpr) | Retourne la somme des produits de yExpr et xExpr calculés à partir des valeurs d’un groupe où xExpr et yExpr sont NOT NULL . |
regr_syy(yExpr, xExpr) | Retourne la somme des carrés des valeurs yExpr d’un groupe où xExpr et yExpr ne sont PAS NULL. |
schema_of_json_agg(json[, options]) | Retourne le schéma combiné de JSON chaînes dans un groupe au format DDL. |
schema_of_variant_agg(variantExpr) | Retourne le schéma combiné de toutes les valeurs VARIANT dans un groupe au format DDL. |
skewness(expr) | Retourne la valeur d’asymétrie calculée à partir des valeurs d’un groupe. |
some(expr) | Retourne la valeur true si au moins une valeur de expr dans un groupe est true . |
std(expr) | Retourne l’écart type de l’échantillon calculé à partir des valeurs du groupe. |
stddev(expr) | Retourne l’écart type de l’échantillon calculé à partir des valeurs du groupe. |
stddev_pop(expr) | Retourne l’écart type de population calculé à partir des valeurs d’un groupe. |
stddev_samp(expr) | Retourne l’écart type de l’échantillon calculé à partir des valeurs d’un groupe. |
sum(expr) | Retourne la somme calculée à partir des valeurs d’un groupe. |
try_avg(expr) | Retourne la moyenne calculée à partir des valeurs d’un groupe, NULL en cas de dépassement de capacité. |
try_sum(expr) | Retourne la somme calculée à partir des valeurs d’un groupe, NULL en cas de dépassement de capacité. |
var_pop(expr) | Retourne l’écart de remplissage calculé à partir des valeurs d’un groupe. |
var_samp(expr) | Retourne l’écart de l’échantillon calculé à partir des valeurs d’un groupe. |
variance(expr) | Retourne l’écart de l’échantillon calculé à partir des valeurs d’un groupe. |
Les fonctions de classement de fenêtre
Fonction | Description |
---|---|
dense_rank() | Retourne le rang d’une valeur par rapport à toutes les valeurs dans la partition. |
ntile(n) | Divise les lignes de chaque partition de fenêtre en n compartiments compris entre 1 et n au maximum. |
percent_rank() | Calcule le classement en pourcentage d’une valeur au sein de la partition. |
rank() | Retourne le rang d’une valeur par rapport à toutes les valeurs dans la partition. |
row_number() | Attribue un nombre séquentiel unique à chaque ligne, en commençant par un, en fonction de l’ordre des lignes dans la partition de fenêtre. |
Fonctions de fenêtre analytique
Fonction | Description |
---|---|
cume_dist() | Retourne la position d’une valeur par rapport à toutes les valeurs de la partition. |
lag(expr[,offset[,default]]) | Retourne la valeur de expr à partir d’une ligne précédente dans la partition. |
lead(expr[,offset[,default]]) | Retourne la valeur de expr à partir d’une ligne suivante dans la partition. |
nth_value(expr, offset[, ignoreNulls]) | Retourne la valeur de expr à un offset spécifique dans la fenêtre. |
Fonctions de tableau
Fonction | Description |
---|---|
arrayExpr[indexExpr] | Retourne l’élément à la position indexExpr du tableau arrayExpr . |
aggregate(expr,start,merge[,finish]) | Agrège les éléments d’un tableau à l’aide d’un agrégateur personnalisé. |
array([expr [, …]]) | Retourne un tableau avec les éléments contenus dans expr . |
array_append(array, elem) | Retourne array ajouté par elem . |
array_compact(array) | Supprime les valeurs NULL de array . |
array_contains(array,value) | Retourne la valeur true si array contient value . |
array_distinct(array) | Supprime les valeurs en double de array . |
array_except(array1,array2) | Retourne un tableau des éléments dans array1 mais pas dans array2 . |
array_insert(array, index, elem) | Retourne un développé array où elem est inséré à la index position. |
array_intersect(array1,array2) | Retourne un tableau des éléments de l’intersection de array1 et array2 . |
array_join(array,delimiter[,nullReplacement]) | Concatène les éléments de array . |
array_max(array) | Retourne la valeur maximale dans array . |
array_min(array) | Retourne la valeur minimale dans array . |
array_position(array,element) | Retourne la position de la première occurrence de element dans array . |
array_prepend(array, elem) | Retourne array une valeur ajoutée par elem . |
array_remove(array,element) | Supprime toutes les occurrences de element de array . |
array_repeat(element,count) | Retourne un tableau contenant element count fois. |
array_size(array) | Retourne le nombre d’éléments contenus dans array . |
array_sort(array,func) | Retourne array trié en fonction de func . |
array_union(array1,array2) | Retourne un tableau des éléments de l’union de array1 et array2 sans doublons. |
arrays_overlap(array1, array2) | Retourne la valeur true si l’intersection de array1 et array2 n’est pas vide. |
arrays_zip(array1 [, …]) | Retourne un tableau fusionné de struct dans lequel l’énième struct contient toutes les énièmes valeurs des tableaux d’entrée. |
cardinality(expr) | Retourne la taille de expr . |
concat(expr1, expr2 [, …]) | Retourne la concaténation des arguments. |
element_at(arrayExpr, index) | Retourne l’élément d’un arrayExpr à index . |
exists(expr, pred) | Retourne la valeur true si pred a la valeur true pour tout élément dans expr . |
explode(collection) | Retourne des lignes en annulant l’imbrication de collection . |
explode_outer(collection) | Retourne des lignes en annulant l’imbrication de collection à l’aide d’une sémantique externe. |
filter(expr,func) | Filtre le tableau dans expr à l’aide de la fonction func . |
flatten(arrayOfArrays) | Transforme un tableau de tableaux en un tableau unique. |
forall(expr, predFunc) | Vérifie si predFunc est valable pour tous les éléments du tableau. |
get(arrayExpr, index) | Retourne l’élément de arrayExpr à index , en commençant par 0 . |
inline(expr) | Éclate un tableau de structs dans une table. |
inline_outer(expr) | Éclate un tableau de structs dans une table avec une sémantique externe. |
posexplode(expr) | Retourne des lignes en annulant l’imbrication du tableau avec la numérotation des positions. |
posexplode_outer(expr) | Retourne des lignes en annulant l’imbrication du tableau avec la numérotation des positions à l’aide de la sémantique OUTER . |
reduce(expr,start,merge[,finish]) | Agrège les éléments d’un tableau à l’aide d’un agrégateur personnalisé. |
reverse(array) | Retourne une chaîne inversée ou un tableau avec l’ordre inverse des éléments. |
sequence(start,stop,step) | Génère un tableau d’éléments de start à stop (inclus), en incrémentant par step . |
shuffle(array) | Retourne une permutation aléatoire du tableau dans expr . |
size(expr) | Retourne la cardinalité de expr . |
slice(expr,start,length) | Retourne un sous-ensemble d’un tableau. |
sort_array(expr[,ascendingOrder]) | Retourne le tableau dans expr dans un ordre trié. |
transform(expr, func) | Transforme des éléments dans un tableau expr à l’aide de la fonction func . |
try_element_at(arrayExpr, index) | Retourne l’élément d’un arrayExpr à index , ou NULL si index est hors limite. |
zip_with(expr1, expr2, func) | Fusionne les tableaux présents dans expr1 et expr2 , élément par élément, en un tableau unique à l’aide de func . |
Fonctions cartographiques
Fonction | Description |
---|---|
mapExpr[keyExpr] | Retourne la valeur à keyExpr du mappage mapExpr . |
cardinality(expr) | Retourne la taille de expr . |
element_at(mapExpr, key) | Retourne la valeur de mapExpr pour key . |
explode(expr) | Retourne des lignes en annulant l’imbrication de expr . |
explode_outer(expr) | Retourne des lignes en annulant l’imbrication de expr à l’aide d’une sémantique externe. |
map([{key1, value1}[, …]]) | Crée un mappage avec les paires clé-valeur données. |
map_concat([expr1 [, …]]) | Retourne l’union de toutes les expressions de mappage expr . |
map_contains_key(map, key) | Retourne true si map contient key , false sinon. |
map_entries(map) | Retourne un tableau non trié de toutes les entrées de map . |
map_filter(expr, func) | Filtre les entrées du mappage dans expr à l’aide de la fonction func . |
map_from_arrays(keys, values) | Crée un mappage avec une paire de tableaux keys et values . |
map_from_entries(expr) | Crée un mappage obtenu à partir du tableau d’entrées spécifié. |
map_keys(map) | Retourne un tableau non trié contenant les clés de map . |
map_values(map) | Retourne un tableau non trié contenant les valeurs de map . |
map_zip_with(map1, map2, func) | Fusionne map1 et map2 dans un mappage unique. |
size(expr) | Retourne la cardinalité de expr . |
str_to_map(expr[,pairDelim[,keyValueDelim]]) | Retourne un mappage après fractionnement deexpr en paires clé-valeur à l’aide de délimiteurs. |
transform_keys(expr, func) | Transforme les clés d’un mappage dans expr à l’aide de la fonction func . |
transform_values(expr, func) | Transforme les valeurs d’un mappage dans expr à l’aide de la fonction func . |
try_element_at(mapExpr, key) | Retourne la valeur de mapExpr pour key , ou NULL si key n’existe pas. |
Fonctions de date, de timestamp et d’intervalle
Pour plus d’informations sur les formats de date et de timestamp, consultez Modèles de DateHeure.
Fonction | Description |
---|---|
intervalExpr / divisor | Retourne l’intervalle divisé par divisor . |
- intervalExpr | Retourne la valeur négative de intervalExpr . |
intervalExpr1 - intervalExpr2 | Retourne la soustraction de intervalExpr2 à partir de intervalExpr1 . |
datetimeExpr1 - datetimeExpr2 | Retourne la soustraction de datetimeExpr2 à partir de datetimeExpr1 . |
+ intervalExpr | Retourne la valeur de intervalExpr . |
intervalExpr1 + intervalExpr2 | Retourne la somme des valeurs intervalExpr1 et intervalExpr2 . |
intervalExpr * multiplicand | Retourne intervalExpr multiplié par multiplicand . |
abs(expr) | Retourne la valeur absolue de la valeur d’intervalle dans expr . |
add_months(startDate,numMonths) | Renvoie la date qui représente numMonths après startDate . |
curdate() | Retourne la date actuelle au début de l’évaluation de la requête. |
current_date() | Retourne la date actuelle au début de l’évaluation de la requête. |
current_timestamp() | Retourne le timestamp actuel au début de l’évaluation de la requête. |
current_timezone() | Retourne le fuseau horaire local de la session actuelle. |
date(expr) | Caste la valeur expr en DATE. |
date_add(startDate,numDays) | Retourne la date numDays après startDate . |
date_add(unit, value, expr) | Ajoute value unit à un timestamp expr . |
date_diff(unit, start, stop) | Retourne la différence entre deux timestamps mesurée en unit s. |
date_format(expr,fmt) | Convertit un timestamp en une chaîne au format fmt . |
date_from_unix_date(days) | Crée une date à partir du nombre de jours écoulés depuis 1970-01-01 . |
date_part(field,expr) | Extrait une partie de la date, du timestamp ou de l’intervalle. |
date_sub(startDate,numDays) | Retourne la date numDays avant startDate . |
date_trunc(unit,expr) | Retourne le timestamp tronqué à l’unité spécifiée dans unit . |
dateadd(startDate,numDays) | Retourne la date numDays après startDate . |
dateadd(unit, value, expr) | Ajoute value unit à un timestamp expr . |
datediff(endDate,startDate) | Retourne le nombre de jours compris entre startDate et endDate . |
datediff(unit, start, stop) | Retourne la différence entre deux timestamps mesurée en unit s. |
day(expr) | Retourne le jour du mois correspondant à la date ou au timestamp. |
dayofmonth(expr) | Retourne le jour du mois correspondant à la date ou au timestamp. |
dayofweek(expr) | Retourne le jour de la semaine correspondant à la date ou au timestamp. |
dayofyear(expr) | Retourne le jour de l’année correspondant à la date ou au timestamp. |
divisor div dividend | Retourne la partie entière de la division de l’intervalle divisor par l’intervalle dividend . |
extract(field FROM source) | Retourne field de source . |
from_unixtime(unixTime,fmt) | Retourne unixTime dans fmt . |
from_utc_timestamp(expr,timezone) | Retourne l’horodatage à UTC un horodatage à l’adresse expr timeZone . |
getdate() | Retourne le timestamp actuel au début de l’évaluation de la requête. |
hour(expr) | Retourne le composant heure d’un timestamp. |
last_day(expr) | Retourne le dernier jour du mois auquel la date appartient. |
make_date(year,month,day) | Crée une date à partir des champs year , month et day . |
make_dt_interval([days[, hours[, mins[, secs]]]]) | Crée un intervalle de jour-heure à partir de days , hours , mins et secs . |
make_interval(years, months, weeks, days, hours, mins, secs) | Déconseillé : crée un intervalle à partir de years , months , weeks , days , hours , mins et secs . |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | Crée un timestamp à partir des champs year , month , day , hour , min , sec et timezone . |
make_ym_interval([years[, months]]) | Crée un intervalle d’année-mois à partir de years et months . |
minute(expr) | Retourne le composant minute du timestamp dans expr . |
month(expr) | Retourne le composant month du timestamp dans expr . |
months_between(expr1,expr2[,roundOff]) | Retourne le nombre de mois écoulés entre les dates ou les timestamps dans expr1 et expr2 . |
next_day(expr,dayOfWeek) | Retourne la première date postérieure à expr et nommée comme dans dayOfWeek . |
now() | Retourne le timestamp actuel au début de l’évaluation de la requête. |
quarter(expr) | Retourne le trimestre de l’année pour expr dans la plage comprise entre 1 et 4. |
second(expr) | Retourne le composant second du timestamp dans expr . |
session_window(expr, gpDuration) | Crée une fenêtre de session sur une expression de timestamp. |
sign(expr) | Retourne -1.0, 0.0 ou 1.0 si expr est négatif, égal à 0 ou positif. |
signum(expr) | Retourne -1.0, 0.0 ou 1.0 si expr est négatif, égal à 0 ou positif. |
timediff(unit, start, stop) | Retourne la différence entre deux timestamps mesurée en unit s. |
timestamp(expr) | Caste expr sur TIMESTAMP . |
timestamp_micros(expr) | Crée un timestamp de expr microsecondes depuis l’époque UTC. |
timestamp_millis(expr) | Crée un timestamp expr en millisecondes depuis l’époque UTC. |
timestamp_seconds(expr) | Crée un timestamp de expr secondes depuis l’époque UTC. |
timestampadd(unit, value, expr) | Ajoute value unit à un timestamp expr . |
timestampdiff(unit, start, stop) | Retourne la différence entre deux timestamps mesurée en unit s. |
to_date(expr[,fmt]) | Retourne un cast de expr en date utilisant une mise en forme facultative. |
to_timestamp(expr[,fmt]) | Retourne un cast de expr en timestamp utilisant une mise en forme facultative. |
to_unix_timestamp(expr[,fmt]) | Retourne le timestamp dans expr en tant que timestamp UNIX. |
to_utc_timestamp(expr,timezone) | Retourne l’horodatage à UTC un horodatage à l’adresse expr timezone . |
trunc(expr, fmt) | Retourne une date avec une partie de la date tronquée à l’unité spécifiée par le modèle de format fmt . |
try_add(expr1, expr2) | Retourne la somme de expr1 et expr2 , ou NULL en cas d’erreur. |
try_divide(dividend, divisor) | Retourne dividend divisé par divisor ou NULL si divisor est égal à 0. |
try_multiply(multiplier, multiplicand) | Retourne multiplier multiplié par multiplicand , ou NULL en cas de dépassement. |
try_subtract(expr1, expr2) | Retourne la soustraction de expr2 à expr1 , ou NULL en cas de dépassement. |
try_to_timestamp(expr[,fmt]) | Retourne le cast expr en timestamp utilisant une mise en forme facultative, ou NULL si le cast échoue. |
unix_date(expr) | Retourne le nombre de jours écoulés depuis 1970-01-01 . |
unix_micros(expr) | Retourne le nombre de microsecondes écoulées depuis 1970-01-01 00:00:00 UTC . |
unix_millis(expr) | Retourne le nombre de millisecondes écoulées depuis 1970-01-01 00:00:00 UTC . |
unix_seconds(expr) | Retourne le nombre de secondes écoulées depuis 1970-01-01 00:00:00 UTC . |
unix_timestamp([expr[, fmt]]) | Retourne le timestamp UNIX de l’heure actuelle ou spécifiée. |
weekday(expr) | Retourne le jour de la semaine de expr . |
weekofyear(expr) | Retourne la semaine de l’année de expr . |
year(expr) | Retourne le composant year de expr . |
window(expr, width[, step[, start]]) | Crée une fenêtre glissante basée sur une saut sur une expression de timestamp. |
window_time(window) | Retourne l’heure de fin inclusive d’une fenêtre glissante produite par la fenêtre ou session_window fonctions. |
Fonctions géospatiales H3
Pour plus d’informations sur les fonctions géospatiales H3, consultez Fonctions géospatiales H3.
Fonctions et constructeurs de cast
Pour plus d’informations sur la conversion entre types, consultez fonction cast et fonction try_cast.
Fonction | Description |
---|---|
array([expr [, …]]) | Retourne un tableau avec les éléments contenus dans expr . |
bigint(expr) | Caste la valeur expr sur BIGINT . |
binary(expr) | Caste la valeur de expr sur BINARY . |
boolean(expr) | Caste expr sur BOOLEAN . |
cast(expr AS type) | Caste la valeur expr vers le type de données cible type . |
expr :: type | Caste la valeur expr vers le type de données cible type . |
date(expr) | Caste la valeur expr sur DATE . |
decimal(expr) | Caste la valeur expr sur DECIMAL . |
double(expr) | Caste la valeur expr sur DOUBLE . |
float(expr) | Caste la valeur expr sur FLOAT . |
int(expr) | Caste la valeur expr sur INTEGER . |
make_date(year,month,day) | Crée une date à partir des champs year , month et day . |
make_dt_interval([days[, hours[, mins[, secs]]]]) | Crée un intervalle de jour-heure à partir de days , hours , mins et secs . |
make_interval(years, months, weeks, days, hours, mins, secs) | Crée un intervalle à partir de years , months , weeks , days , hours , mins et secs . |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | Crée un timestamp à partir des champs year , month , day , hour , min , sec et timezone . |
make_ym_interval([years[, months]]) | Crée un intervalle d’année-mois à partir de years et months . |
map([{key1, value1} [, …]]) | Crée un mappage avec les paires clé-valeur données. |
named_struct({name1, val1} [, …]) | Crée un struct avec les noms et valeurs de champs spécifiés. |
smallint(expr) | Caste la valeur expr sur SMALLINT . |
string(expr) | Caste la valeur expr sur STRING . |
struct(expr1 [, …]) | Crée un STRUCT avec les valeurs de champs spécifiées. |
tinyint(expr) | Caste expr sur TINYINT . |
timestamp(expr) | Caste expr sur TIMESTAMP . |
to_char(expr, fmt) | Retourne expr casté en STRING en utilisant la mise en forme fmt ». |
to_date(expr[,fmt]) | Retourne un cast de expr en date utilisant une mise en forme facultative. |
to_number(expr, fmt) | Retourne expr casté sur DECIMA en utilisant la mise en forme fmt . |
to_timestamp(expr[,fmt]) | Retourne un cast de expr en timestamp utilisant une mise en forme facultative. |
to_varchar(expr, fmt) | Retourne expr casté en STRING en utilisant la mise en forme fmt ». |
try_cast(expr AS type) | Caste la valeur expr vers le type de données cible type en toute sécurité. |
try_to_number(expr, fmt) | Retourne expr casté sur DECIMAL à l’aide de la mise en forme fmt , ou NULL si expr n’est pas valide. |
Fonctions CSV et Avro
Fonction | Description |
---|---|
from_avro(avroBin, jsonSchema[, options]) | Retourne une valeur de struct basée sur avroBin et jsonSchema . |
from_csv(csvStr, schema[, options]) | Retourne une valeur de struct avec csvStr et schema . |
schema_of_csv(csv[, options]) | Retourne le schéma d’une chaîne CSV au format DDL. |
to_avro(expr[, options]) | Retourne une valeur binaire Avro avec la valeur de struct spécifiée. |
to_csv(expr[, options]) | Retourne une chaîne CSV avec la valeur de struct spécifiée. |
Fonctions JSON
Fonction | Description |
---|---|
jsonStr : jsonPath | Retourne les champs extraits du jsonStr . |
from_json(jsonStr, schema[, options]) | Retourne une valeur de struct avec jsonStr et schema . |
get_json_object(expr, path) | Extrait un objet JSON de path . |
json_array_length(jsonArray) | Retourne le nombre d’éléments du tableau JSON le plus à l’extérieur. |
json_object_keys(jsonObject) | Retourne toutes les clés de l’objet JSON le plus éloigné sous forme de tableau. |
json_tuple(jsonStr, path1 [, …]) | Retourne plusieurs objets JSON sous forme de tuple. |
parse_json(jsonStr) | Retourne une valeur VARIANT à partir de jsonStr . |
schema_of_json(jsonStr[, options]) | Retourne le schéma d’une chaîne JSON au format DDL. |
schema_of_json_agg(jsonStr[, options]) | Retourne le schéma combiné de JSON chaînes dans un groupe au format DDL. |
to_json(expr[, options]) | Retourne une chaîne JSON avec le STRUCT ou VARIANT spécifié dans expr . |
Fonctions VARIANT
Fonction | Description |
---|---|
variantExpr : jsonPath | Retourne les champs extraits de variantExpr à l’aide du chemin JSON. |
is_variant_null(variantExpr) | Teste si variantExpr est encodé en VARIANT avec la valeur NULL . |
parse_json(jsonStr) | Retourne une valeur VARIANT à partir de jsonStr . |
schema_of_variant(variantExpr) | Retourne le schéma d’une expression VARIANT au format DDL. |
schema_of_variant_agg(variantExpr) | Retourne le schéma combiné de toutes les valeurs VARIANT dans un groupe au format DDL. |
to_json(expr[, options]) | Retourne une chaîne JSON avec le STRUCT ou VARIANT spécifié dans expr . |
try_parse_json(jsonStr) | Retourne une valeur VARIANT du jsonStr , le cas échéant. Si ce n’est pas possible, retourne NULL . |
try_variant_get(variantExpr,path,type) | Extrait une valeur de type type à partir de variantExpr , spécifiée par path , ou NULL s’il n’est pas possible de forcer le type cible. |
variant_explode(variantExpr) | Retourne un ensemble de lignes en dés imbrication variantExpr . |
variant_explode_outer(variantExpr) | Retourne un ensemble de lignes en annulant l’imbrication de variantExpr à l’aide d’une sémantique externe. |
variant_get(variantExpr,path,type) | Extrait une valeur de type type à partir de variantExpr , spécifié par path . |
Fonctions XPath et XML
Fonction | Description |
---|---|
from_xml(xmlStr, schema[, options]) | Renvoie une valeur de structure analysée à partir de xmlStr en utilisant schema . |
schema_of_xml(xmlStr[, options]) | Retourne le schéma d’une chaîne XML au format DDL. |
xpath(xml, xpath) | Retourne des valeurs dans les nœuds de xml qui correspondent à xpath . |
xpath_boolean(xml, xpath) | Retourne true si l’expression xpath prend la valeur true , ou si un nœud correspondant dans xml est trouvé. |
xpath_double(xml, xpath) | Retourne une valeur DOUBLE à partir d’un document XML. |
xpath_float(xml, xpath) | Retourne une valeur FLOAT à partir d’un document XML. |
xpath_int(xml, xpath) | Retourne une valeur INTEGER à partir d’un document XML. |
xpath_long(xml, xpath) | Retourne une valeur BIGINT à partir d’un document XML. |
xpath_number(xml, xpath) | Retourne une valeur DOUBLE à partir d’un document XML. |
xpath_short(xml, xpath) | Retourne une valeur SHORT à partir d’un document XML. |
xpath_string(xml, xpath) | Retourne le contenu du premier nœud XML correspondant à l’expression XPath. |
Fonctions IA
Fonction | Description |
---|---|
ai_analyze_sentiment(contenu) | Retourne le sentiment d’un texte. |
ai_classify(contenu, étiquettes) | Classe le contenu fourni dans l’une des étiquettes fournies. |
ai_extract(contenu, étiquettes) | Extrait les entités spécifiées par les étiquettes d’un texte donné. |
ai_fix_grammar(contenu) | Corrige les erreurs grammaticales dans un texte donné. |
ai_forecast(observed, time_col) | Extrapole les données de série chronologique à l’avenir. |
ai_gen(contenu) | Invoque un modèle d’IA génératif de pointe à partir des API du modèle Databricks Foundation pour répondre à l’invite fournie par l’utilisateur. |
ai_generate_text(prompt, modelName[, param1, value1] […]) | Déconseillé : retourne du texte généré par un modèle de langage volumineux sélectionné (LLM) en fonction de l’invite. |
ai_mask(contenu, étiquettes) | Masque les entités spécifiées dans un texte donné. |
ai_query(endpointName, request, returnType) | Appelle un point de terminaison Service de modèles Mosaic AI existant, analyse et retourne sa réponse. |
ai_similarity(strExpr1, strExpr2) | Compare deux chaînes et calcule le score de similarité sémantique. |
ai_summarize(contenu[, max_words]) | Génère un résumé d’un texte donné. |
ai_translate(contenu, to_lang) | Convertit le texte en langue cible spécifiée. |
vector_search(index, query, num_results) | Interrogez un index de recherche vectorielle d’IA mosaïque à l’aide de SQL. |
Lire des fonctions
Fonction | Description |
---|---|
read_files(path, [optionKey => optionValue] [, …]) | Permet de lire des fichiers de données sur un stockage cloud et de les retourner au format tabulaire. |
read_kafka([optionKey => optionValue] [, …]) | Permet de lire des enregistrements d’un cluster Apache Kafka et de les retourner au format tabulaire. |
read_kinesis({parameter=>value}[, …]) | Retourne une table avec des enregistrements lus à partir de Kinesis d’un ou plusieurs flux. |
read_pubsub([parameter => value] [, …]) | Fonction table pour la lecture d’enregistrements à partir de Pub/Sub à partir d’une rubrique. |
read_pulsar({optionKey => optionValue} [, …]) | Retourne une table avec des enregistrements lus à partir de Pulsar. |
read_state_metadata(path) | Retourne une table avec des lignes qui représentent les métadonnées d’un état de requête de diffusion en continu. |
read_statestore(path [, option_key => option_value] […]) | Retourne des enregistrements à partir du magasin d’état des requêtes de diffusion en continu. |
Fonctions diverses
Fonction | Description |
---|---|
assert_true(expr) | Retourne une erreur si expr n’a pas la valeur true. |
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END | Retourne resN pour le premier optN qui est égal à expr ou def si aucune correspondance n’est trouvée. |
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END | Retourne resN pour le premier condN qui prend la valeur true, ou def si aucun n’est trouvé. |
cloud_files_state( { TABLE(table) | checkpoint } ) | Retourne l’état au niveau du fichier d’une source cloud_files de chargeur automatique. |
coalesce(expr1, expr2 [, …]) | Retourne le premier argument non null. |
cube (expr1 [, …]) | Crée un cube multidimensionnel à l’aide des colonnes d’expression spécifiées. |
current_catalog() | Retourne le catalogue actuel. |
current_database() | Retourne le schéma actuel. |
current_metastore() | Retourne l’ID du metastore Unity Catalog actuel. |
current_recipient(key) | Renvoie une propriété pour le destinataire actuel dans un affichage partagé avec Delta Sharing. |
current_schema() | Retourne le schéma actuel. |
current_user() | Retourne l’utilisateur exécutant l’instruction. |
current_version() | Retourne la version actuelle de Azure Databricks. |
decode(expr, { key, value } [, …] [,defValue]) | Retourne la valeur correspondant à la clé. |
elt(index, expr1 [, …] ) | Retourne la nième expression. |
equal_null(expr1, expr2) | Retourne true si expr1 est égal à expr2 ou si les deux expressions sont NULL ; sinon, false . |
event_log( { TABLE(table) | pipeline_id } ) | Retourne une table de l’historique d’actualisation pour une vue matérialisée, une table de diffusion en continu ou un pipeline DLT. |
greatest(expr1, expr2 [, …]) | Retourne la plus grande valeur de tous les arguments, en ignorant les valeurs null. |
grouping(col) | Indique si une colonne spécifiée dans un GROUPING SET , un ROLLUP ou un CUBE représente un sous-total. |
grouping_id([col1 [, …]]) | Retourne le niveau de regroupement d’un ensemble de colonnes. |
hash(expr1 [, …]) | Retourne une valeur de hachage des arguments. |
hll_sketch_estimate(expr) | Estime le nombre de valeurs distinctes collectées dans un croquis HyperLogLog. |
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) | Combine deux croquis HyperLogLog. |
java_method(class, method[, arg1 [, …]]) | Appelle une méthode avec réflexion. |
if(cond, expr1, expr2) | Retourne expr1 si cond a la valeur true , sinon expr2 . |
iff(cond, expr1, expr2) | Retourne expr1 si cond a la valeur true , sinon expr2 . |
ifnull(expr1, expr2) | Retourne expr2 si expr1 a la valeur NULL , sinon expr1 . |
input_file_block_length() | Retourne la longueur en octets du bloc en cours de lecture. |
input_file_block_start() | Retourne le décalage de début en octets du bloc en cours de lecture. |
input_file_name() | Retourne le nom du fichier en cours de lecture, ou une chaîne vide s’il n’est pas disponible. |
is_account_group_member(group) | Retourne vrai (true) si l’utilisateur actuel est membre du groupe au niveau du compte. |
is_member(group) | Retourne vrai (true) si l’utilisateur actuel est membre du groupe au niveau de l’espace de travail. |
isnull(expr) | Retourne la valeur true si expr a la valeur NULL . |
isnotnull(expr) | Retourne true si expr n’a pas la valeur NULL . |
least(expr1, expr2 [, …]) | Retourne la plus petite valeur de tous les arguments, en ignorant les valeurs null. |
list_secrets([scopeStr]) | Retourne les clés dans une ou toutes les étendues que l’utilisateur est autorisé à voir à partir du service de secret Databricks. |
luhn_check(numStr) | Retourne true si numStr passe l’algorithme Luhn case activée. |
monotonically_increasing_id() | Retourne des entiers 64 bits à incrémentation monotone. |
nullif(expr1, expr2) | Retourne NULL si expr1 est égal à expr2 , sinon expr1 . |
nvl(expr1, expr2) | Retourne expr2 si expr1 a la valeur NULL , sinon expr1 . |
nvl2(expr1, expr2, expr3) | Retourne expr2 si expr1 n’a pas la valeur NULL , sinon expr3 . |
raise_error(expr) | Lève une exception avec expr en tant que message. |
range(end) | Retourne une table de valeurs dans une plage spécifiée. |
range(start, end [, step [, numParts]]) | Retourne une table de valeurs dans une plage spécifiée. |
reflect(class, method[, arg1 [, …]]) | Appelle une méthode avec réflexion. |
secret(scope, key) | Extrait une valeur secrète avec les valeurs scope et key données à partir du service secret Databricks. |
session_user() | Retourne l’utilisateur connecté à Azure Databricks. |
spark_partition_id() | Retourne l’ID de la partition actuelle. |
sql_keywords() | Retourne l’ensemble de mots clés SQL dans Azure Databricks. |
stack(numRows, expr1 [, …]) | Sépare expr1 , …, exprN en numRows lignes. |
table_changes(table_str, start [, end]) | Retourne un journal des modifications apportées à une table Delta Lake avec le flux de données de modifications activé. |
try_reflect(class, method[, arg1 [, …]]) | Appelle une méthode avec réflexion, retournant NULL en cas d’échec de la méthode. |
try_secret(scope, key) | Extrait une valeur de secret avec les valeurs de scope et de key auprès du service des secrets Databricks, ou NULL si la clé ne peut pas être récupérée. |
typeof(expr) | Retourne une chaîne de type au format DDL pour le type de données de expr . |
user() | Retourne l’utilisateur exécutant l’instruction. |
uuid() | Retourne une chaîne d’identificateur unique universel (UUID). |
window(expr, width[, step [, start]]) | Crée une fenêtre glissante basée sur une saut sur une expression de timestamp. |
xxhash64(expr1 [, …]) | Retourne une valeur de code de hachage 64 bits des arguments. |
version() | Retourne la version d’Apache Spark. |