Funciones integradas
Se aplica a: Databricks SQL Databricks Runtime
En este artículo se presentan vínculos y descripciones de operadores integrados y funciones para cadenas y tipos binarios, escalares numéricos, agregaciones, ventanas, matrices, mapas, fechas y marcas de tiempo, conversión, datos CSV, datos JSON, manipulación de XPath y otras funciones diversas.
En casos de uso que no son compatibles con las funciones integradas existentes, considere la posibilidad de definir una función personalizada. Consulte ¿Qué son las funciones definidas por el usuario (UDF)?.
Consulte también:
Operadores y predicados
Para obtener información sobre cómo se analizan los operadores entre sí, consulte Prioridad de los operadores.
Operador | Sintaxis | Descripción |
---|---|---|
& | expr1 & expr2 |
Devuelve el bit a bit AND de expr1 y expr2 . |
and | expr1 and expr2 |
Devuelve el AND lógico de expr1 y expr2 . |
* | multiplier * multiplicand |
Devuelve multiplier multiplicado por multiplicand . |
!= | expr1 != expr2 |
Devuelve true si expr1 no es igual a expr2 , o false de lo contrario. |
! | !expr |
Devuelve el operador NOT lógico de una expresión booleana. |
between | expr1 [not] between expr2 and expr2 |
Comprueba si expr1 es mayor o igual que expr2 y menor o igual que expr3 . |
[ ] | arrayExpr [ indexExpr ] |
Devuelve el elemento indexExpr de ARRAY arrayExpr . |
[ ] | mapExpr [ keyExpr ] |
Devuelve el valor en keyExpr de MAP mapExpr . |
^ | expr1 ^ expr2 |
Devuelve la exclusiva bit a bit OR (XOR) de expr1 y expr2 . |
: | jsonStr : jsonPath |
Devuelve los campos extraídos de jsonStr . |
:: | expr :: type |
Convierte el valor expr al tipo de datos de destino type . |
?:: | expr ?:: type |
Convierte el valor expr en el tipo de datos de destino type , si es posible. De lo contrario, devuelve NULL . |
div | dividend div divisor |
Devuelve la parte integral de la división de dividend por divisor . |
. | mapExpr . keyIdentifier |
Devuelve un valor de MAP mediante keyIdentifier . |
. | structExpr . fieldIdentifier |
Devuelve un campo STRUCT mediante fieldIdentifier . |
== | expr1 == expr2 |
Devuelve true si expr1 es igual a expr2 , de lo contrario, devuelve false . |
= | expr1 = expr2 |
Devuelve true si expr1 es igual a expr2 , de lo contrario, devuelve false . |
>= | expr1 >= expr2 |
Devuelve true si expr1 es mayor o igual que expr2 ; en caso contrario, devuelve false . |
> | expr1 > expr2 |
Devuelve true si expr1 es mayor que expr2 ; en caso contrario, devuelve false . |
exists | exists(query) |
Devuelve true si query devuelve al menos una fila, o false en caso contrario. |
ilike | str [not] ilike (pattern[ESCAPE escape]) |
Devuelve true si str (no) coincide pattern con escape sin distinción de mayúsculas y minúsculas. |
ilike | str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) |
Devuelve true si str (no) coincide con ninguno o todos los patrones sin distinción de mayúsculas y minúsculas. |
in | elem [not] in (expr1[, ...]) |
Devuelve true si elem (no) es igual a exprN . |
in | elem [not] in (query) |
Devuelve true si elem (no) es igual a cualquier fila de query . |
is distinct | expr1 is [not] distinct from expr2 |
Comprueba si los argumentos (no) tienen valores diferentes donde los valores NULL se consideran valores comparables. |
is false | expr is [not] false |
Comprueba si expr (no) es false . |
is null | expr is [not] null |
Devuelve true si expr (no) es NULL . |
is true | expr is [not] true |
Comprueba si expr (no) es true . |
like | str [not] like (pattern[ESCAPE escape]) |
Devuelve true si str (no) coincide pattern con escape . |
like | str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) |
Devuelve true si str (no) coincide con ninguno o todos los patrones. |
<=> | expr1 <=> expr2 |
Devuelve el mismo resultado que EQUAL(=) para los operandos que no son NULL, pero devuelve true si los dos son NULL , o bien false si uno de ellos es NULL . |
<= | expr1 <= expr2 |
Devuelve true si expr1 es menor o igual que expr2 , o false en caso contrario. |
<> | expr1 <> expr2 |
Devuelve true si expr1 no es igual a expr2 ; en caso contrario, es false . |
< | expr1 < expr2 |
Devuelve true si expr1 es menor que expr2 , o false en caso contrario. |
- | expr1 - expr2 |
Devuelve la resta de expr2 de expr1 . |
not | not expr |
Devuelve el operador NOT lógico de una expresión booleana. |
or | expr1 or expr2 |
Devuelve el OR lógico de expr1 y expr2 . |
% | dividend % divisor |
Devuelve el resto después de dividend / divisor . |
|| | expr1 \|\| expr2 |
Devuelve la concatenación de expr1 y expr2 . |
| | expr1 \| expr2 |
Devuelve el bit a bit OR de expr1 y expr2 . |
+ | expr1 + expr2 |
Devuelve la suma de expr1 y expr2 . |
regexp | str [not] regexp regex |
Devuelve true si str (no) coincide con regex . |
regexp_like | str [not] regexp_like regex |
Devuelve true si str (no) coincide con regex . |
rlike | str [not] rlike regex |
Devuelve true si str (no) coincide con regex . |
/ | dividend / divisor |
Devuelve dividend dividido por divisor . |
~ | ~ expr |
Devuelve el bit a bit NOT de expr . |
Precedencia de operadores
Prioridad | Operador |
---|---|
1 | : , :: , , ?:: , [ ] |
2 | - (unario), + (unario), ~ |
3 | * , / , , % , div |
4 | + , , - , \|\| |
5 | & |
6 | ^ |
7 | \| |
8 | = , == , <=> , <> , != , < , <= , , > >= |
9 | not , exists |
10 | between , in , rlike , regexp , ilike , like , , is [not] [NULL, true, false] is [not] distinct from |
11 | and |
12 | or |
Funciones de cadena y binarias
Función | Descripción |
---|---|
expr1 || expr2 | Devuelve la concatenación de expr1 y expr2 . |
aes_decrypt(expresión, clave[, modo[, relleno[, aad]]]) | Descifra un expr binario mediante el cifrado AES. |
aes_encrypt(expresión, clave[, modo[, relleno[, iv[, aad]]]]) | Cifra un expr binario mediante el cifrado AES. |
ascii(str) | Devuelve el punto de código ASCII del primer carácter de str . |
base64(expr) | Convierte expr en una cadena en base 64. |
bin(expr) | Devuelve la representación binaria de expr . |
binary(expr) | Convierte el valor de expr en BINARY . |
bit_length(expr) | Devuelve la longitud de bits de los datos de cadena o el número de bits de los datos binarios. |
bitmap_count(expr) | Devuelve el número de bits establecidos en una BINARY cadena que representa un mapa de bits. |
btrim(str [, trimStr]) | Devuelve str con los caracteres iniciales y finales eliminados. |
char(expr) | Devuelve el carácter en el punto de código UTF-16 proporcionado. |
char_length(expr) | Devuelve la longitud de caracteres de los datos de cadena o el número de bytes de datos binarios. |
character_length(expr) | Devuelve la longitud de caracteres de los datos de cadena o el número de bytes de datos binarios. |
charindex(substr, str[, pos]) | Devuelve la posición de la primera aparición de substr en str después de la posición pos . |
chr(expr) | Devuelve el carácter en el punto de código UTF-16 proporcionado. |
concat(expr1, expr2[, …]) | Devuelve la concatenación de los argumentos. |
concat_ws(sep[, expr1[, …]]) | Devuelve las cadenas de concatenación separadas por sep . |
contains(expr, subExpr) | Devuelve true si expr STRING o BINARY contiene subExpr . |
crc32(expr) | Devuelve un valor de comprobación de redundancia cíclica de expr . |
decode(expr, charSet) | Convierte expr binario en una cadena mediante la codificación del juego de caracteres charSet . |
encode(expr, charSet) | Devuelve la representación binaria de una cadena mediante la codificación de caracteres charSet . |
endswith(expr, endExpr) | Devuelve true si expr STRING o BINARY termina con endExpr . |
find_in_set(searchExpr, sourceExpr) | Devuelve la posición de una cadena en una lista de cadenas separadas por comas. |
format_number(expr, scale) | Da a expr el formato #,###,###.## , redondeado a scale posiciones decimales. |
format_number(expr, fmt) | Da a expr el formato fmt . |
format_string(strfmt[, obj1 [, …]]) | Devuelve una cadena con formato a partir de cadenas de formato de estilo printf. |
hex(expr) | Convierte expr en hexadecimal. |
str ilike (pattern[ESCAPE escape]) | Devuelve true si str coincide pattern con escape sin distinción de mayúsculas y minúsculas. |
initcap(expr) | Devuelve expr con la primera letra de cada palabra en mayúsculas. |
instr(str, substr) | Devuelve el índice (de base 1) de la primera aparición de substr en str . |
lcase(expr) | Devuelve expr con todos los caracteres cambiados a minúsculas. |
left(str, len) | Devuelve el número de caracteres que indica len más a la izquierda de str . |
len(expr) | Devuelve la longitud de caracteres de los datos de cadena o el número de bytes de datos binarios. |
length(expr) | Devuelve la longitud de caracteres de los datos de cadena o el número de bytes de datos binarios. |
levenshtein(str1, str2) | Devuelve la distancia de Levenshtein entre las cadenas str1 y str2 . |
str like (pattern[ESCAPE escape]) | Devuelve true si str coincide pattern con escape . |
locate(substr, str[, pos]) | Devuelve la posición de la primera aparición de substr en str después de la posición pos . |
lower(expr) | Devuelve expr con todos los caracteres cambiados a minúsculas. |
lpad(expr, len[, pad]) | Devuelve expr , rellenado a la izquierda con pad a una longitud de len . |
ltrim([trimstr,] str) | Devuelve str con los caracteres iniciales que indica trimStr quitados. |
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) | Devuelve una versión enmascarada de la entrada str . |
md5(expr) | Devuelve una suma de comprobación MD5 de 128 bits de expr como cadena hexadecimal. |
octet_length(expr) | Devuelve la longitud en bytes de los datos de cadena o el número de bytes de los datos binarios. |
overlay(input PLACING replace FROM pos [FOR len]) | Reemplaza input por replace , que comienza en pos y cuya longitud es len . |
parse_url(url, partToExtract[, key]) | Extrae una parte de url . |
position(substr, str[, pos]) | Devuelve la posición de la primera aparición de substr en str después de la posición pos . |
position(subtr IN str) | Devuelve la posición de la primera aparición de substr en str después de la posición pos . |
printf(strfmt[, obj1 [, …]]) | Devuelve una cadena con formato a partir de cadenas de formato de estilo printf. |
str regexp regex | Devuelve true si str coincide con regex . |
str regexp_like regex | Devuelve true si str coincide con regex . |
regexp_count(str, regexp) | Devuelve el número de veces que str coincide con el patrón regexp . |
regexp_extract(str, regexp[, idx]) | Extrae la primera cadena de str que coincide con la expresión regexp y corresponde al índice de grupo regex . |
regexp_extract_all(str, regexp[, idx]) | Extrae todas las cadenas de str que coinciden con la expresión regexp y corresponden al índice de grupo regex . |
regexp_instr(str, regexp) | Devuelve la posición de la primera subcadena de str que coincide con regexp . |
regexp_replace(str, regexp, rep[, position]) | Reemplaza todas las subcadenas de str que coinciden regexp con rep . |
regexp_substr(str, regexp) | Devuelve la primera subcadena de str que coincide con regexp . |
repeat(expr, n) | Devuelve la cadena que se repite expr n veces. |
replace(str, search [, replace]) | Reemplaza todas las repeticiones de search por replace . |
reverse(expr) | Devuelve una cadena invertida o una matriz con los elementos en orden inverso. |
right(str, len) | Devuelve los caracteres len más a la derecha de la cadena str . |
str rlike regex | Devuelve true si str coincide con regex . |
rpad(expr, len[, pad]) | Devuelve expr , rellenado a la derecha con pad hasta una longitud de len . |
rtrim([trimStr,] str) | Devuelve str con los caracteres finales quitados. |
sentences(str[, lang, country]) | Divide str en una matriz de matriz de palabras. |
sha(expr) | Devuelve un valor hash sha1 como cadena hexadecimal de expr . |
sha1(expr) | Devuelve un valor hash sha1 como cadena hexadecimal de expr . |
sha2(expr, bitLength) | Devuelve una suma de comprobación de la familia SHA-2 como cadena hexadecimal de expr . |
soundex(expr) | Devuelve el código soundex de la cadena. |
space(n) | Devuelve una cadena con n espacios. |
split(str, regex[, limit]) | Divide str en torno a las repeticiones que coinciden con regex y devuelve una matriz con una longitud máxima de limit . |
split_part(str, delim, partNum) | str Se divide en torno a las repeticiones de delim y devuelve la partNum parte. |
startswith(expr, startExpr) | Devuelve true si expr STRING o BINARY comienza con startExpr . |
string(expr) | Convierte el valor expr en STRING . |
substr(expr, pos[, len]) | Devuelve el substring de expr que comienza en pos y su longitud es len . |
substr(expr FROM pos[ FOR len]) | Devuelve el substring de expr que comienza en pos y su longitud es len . |
substring(expr, pos[, len]) | Devuelve el substring de expr que comienza en pos y su longitud es len . |
substring(expr FROM pos[ FOR len]) | Devuelve el substring de expr que comienza en pos y su longitud es len . |
substring_index(expr, delim, count) | Devuelve la subcadena de expr antes de count repeticiones del delimitador delim . |
to_binary(expr[, fmt]) | Devuelve la conversión de expr a un Binario basado en fmt . |
to_char(numExpr, fmt) | Devuelve numExpr convertido a STRING utilizando el formato fmt ". |
to_varchar(numExpr, fmt) | Devuelve numExpr convertido a STRING utilizando el formato fmt ". |
translate(expr, from, to) | Devuelve un expr donde todos los caracteres de from se han reemplazado por los de to . |
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) | Recorta los caracteres de una cadena. |
try_aes_decrypt(expresión, clave[, modo[, relleno[, aad]]]) | Descifra un binario expr mediante el cifrado AES y devuelve NULL en caso de error. |
try_to_binary(expr [, fmt]) | Devuelve expr convertir a BINARY en función de fmt , o NULL si la entrada no es válida. |
try_url_decode(str) | Traduce una cadena de vuelta del formato application/x-www-form-urlencoded y devuelve NULL en caso de error. |
try_zstd_decompress(value) | Devuelve el valor descomprimido con la compresión Zstandard, o NULL si la entrada no es válida. |
ucase(expr) | Devuelve expr con todos los caracteres cambiados a mayúsculas. |
unbase64(expr) | Devuelve una cadena descodificada en base64 como binaria. |
unhex(expr) | Convierte expr hexadecimal en BINARY . |
upper(expr) | Devuelve expr con todos los caracteres cambiados a mayúsculas. |
url_decode(str) | Traslada una cadena de nuevo desde el formato application/x-www-form-urlencoded. |
url_encode(str) | Esta función se usa para trasladar una cadena al formato application/x-www-form-urlencoded. |
zstd_compress (value[,level[,streaming_mode]]) | Devuelve el valor comprimido con compresión Zstandard. |
zstd_decompress(value) | Devuelve el valor descomprimido con compresión Zstandard. |
Funciones escalares numéricas
Función | Descripción |
---|---|
~ expr | Devuelve el NOT bit a bit de expr . |
dividend / divisor | Devuelve dividend dividido por divisor . |
expr1 | expr2 | Devuelve el bit a bit OR de expr1 y expr2 . |
- expr | Devuelve el valor negado de expr . |
expr1 - expr2 | Devuelve la resta de expr2 de expr1 . |
+ expr | Devuelve el valor de expr . |
expr1 + expr2 | Devuelve la suma de expr1 y expr2 . |
dividend % divisor | Devuelve el resto después de dividend / divisor . |
expr1 ^ expr2 | Devuelve la exclusiva bit a bit OR (XOR) de expr1 y expr2 . |
expr1 & expr2 | Devuelve el bit a bit AND de expr1 y expr2 . |
multiplier * multiplicand | Devuelve multiplier multiplicado por multiplicand . |
abs(expr) | Devuelve el valor absoluto del valor numérico en expr . |
acos(expr) | Devuelve el coseno inverso (arcocoseno) de expr . |
acosh(expr) | Devuelve el coseno hiperbólico inverso de expr . |
asin(expr) | Devuelve el seno inverso (arcoseno) de expr . |
asinh(expr) | Devuelve el seno hiperbólico inverso de expr . |
atan(expr) | Devuelve la tangente inversa (arcotangente) de expr . |
atan2(exprY, exprX) | Devuelve el ángulo en radianes entre el eje X positivo de un plano y el punto que se especifica con las coordenadas (exprX y exprY ). |
atanh(expr) | Devuelve una tangente hiperbólica inversa de expr . |
bigint(expr) | Convierte el valor expr en BIGINT . |
bit_count(expr) | Devuelve el número de bits establecidos en el argumento. |
bit_get(expr, pos) | Devuelve el valor de un bit en una representación binaria de un valor numérico entero. |
bit_reverse(expr) | Devuelve el valor obtenido al invertir el orden de los bits en el argumento. |
bitmap_bit_position(expr) | Devuelve la posición en bits basada en 0 de un BIGINT número dado dentro de un cubo. |
bitmap_bucket_number(expr) | Devuelve el número de cubo del mapa de bits para un BIGINT número dado. |
bround(expr[,targetScale]) | Devuelve el valor expr redondeado mediante el modo de redondeo HALF_EVEN . |
cbrt(expr) | Devuelve la raíz cúbica de expr . |
ceil(expr[,targetScale]) | Esta función devuelve el número más pequeño no menor que el valor del elemento expr y redondeado hacia arriba hasta los dígitos targetScale relativos a la coma decimal. |
ceiling(expr[,targetScale]) | Esta función devuelve el número más pequeño no menor que el valor del elemento expr y redondeado hacia arriba hasta los dígitos targetScale relativos a la coma decimal. |
conv(num, fromBase, toBase) | Convierte num de fromBase a toBase . |
convert_timezone([sourceTz, ]targetTz, sourceTs) | Convierte el TIMESTAMP_NTZ sourceTs de la zona horaria de sourceTz en targetTz . |
cos(expr) | Devuelve el coseno de expr . |
cosh(expr) | Devuelve el coseno hiperbólico de expr . |
cot(expr) | Devuelve la cotangente de expr . |
csc(expr) | Devuelve el cosecante de expr . |
decimal(expr) | Convierte el valor expr en DECIMAL . |
degrees(expr) | Convierte radianes en grados. |
divisor div dividend | Devuelve la parte integral de la división de divisor por dividend . |
double(expr) | Convierte el valor expr en DOUBLE . |
e() | Devuelve la constante e . |
exp(expr) | Devuelve e elevado a expr . |
expm1(expr) | Devuelve exp(expr) - 1 . |
factorial(expr) | Devuelve el factorial de expr . |
float(expr) | Convierte el valor expr en FLOAT . |
floor(expr[,targetScale]) | Esta función devuelve el número más grande no menor que el valor del elemento expr y redondeado hacia abajo hasta los dígitos targetScale relativos a la coma decimal. |
getbit(expr, pos) | Devuelve el valor de un bit en una representación binaria de un valor numérico entero. |
hypot(expr1, expr2) | Devuelve sqrt(expr1 * expr1 + expr2 * expr2) . |
int(expr) | Convierte el valor expr en INTEGER . |
isnan(expr) | Devuelve true si expr es NaN . |
ln(expr) | Devuelve el logaritmo natural (en base e ) de expr . |
log([base,] expr) | Devuelve el logaritmo de expr con base . |
log1p(expr) | Devuelve log(1 + expr) . |
log2(expr) | Devuelve el logaritmo de expr en base 2 . |
log10(expr) | Devuelve el logaritmo de expr en base 10 . |
mod(dividend, divisor) | Devuelve el resto después de dividend / divisor . |
nanvl(expr1, expr2) | Devuelve expr1 si no es NaN ; de lo contrario, expr2 . |
negative(expr) | Devuelve el valor negado de expr . |
'nullifzero(expr)' | Devuelve expr si no es cero o NULL si no es así. |
pi() | Devuelve pi. |
pmod(dividend, divisor) | Devuelve el resto positivo después de dividend / divisor . |
positive(expr) | Devuelve el valor de expr . |
pow(expr1, expr2) | Eleva expr1 a la potencia de expr2 . |
power(expr1, expr2) | Eleva expr1 a la potencia de expr2 . |
radians(expr) | Convierte expr en grados en radianes. |
rand([seed]) | Devuelve un valor aleatorio entre 0 y 1. |
randn([seed]) | Devuelve un valor aleatorio a partir de una distribución normal estándar. |
random([seed]) | Devuelve un valor aleatorio entre 0 y 1. |
rint(expr) | Devuelve expr redondeado a un número entero como DOUBLE . |
round(expr[,targetScale]) | Devuelve el valor expr redondeado mediante el modo de redondeo HALF_UP . |
sec(expr) | Devuelve la secante de expr . |
shiftleft(expr, n) | Devuelve un bit a bit desplazado a la izquierda n bits. |
shiftright(expr, n) | Devuelve un número entero con signo con signo desplazado n bits a la derecha. |
shiftrightunsigned(expr, n) | Devuelve un número entero con signo sin signo desplazado n bits a la derecha. |
sign(expr) | Devuelve -1.0, 0.0 o 1.0 en función de que expr sea negativo, 0 o positivo. |
signum(expr) | Devuelve -1.0, 0.0 o 1.0 en función de que expr sea negativo, 0 o positivo. |
sin(expr) | Devuelve el seno de expr . |
sinh(expr) | Devuelve el seno hiperbólico de expr . |
smallint(expr) | Convierte el valor expr en SMALLINT . |
sqrt(expr) | Devuelve la raíz cuadrada de expr . |
tan(expr) | Devuelve la tangente de expr . |
tanh(expr) | Devuelve la tangente hiperbólica de expr . |
tinyint(expr) | Convierte expr en TINYINT . |
to_number(expr, fmt) | Devuelve expr convertido a DECIMAL utilizando el formato fmt . |
try_add(expr1, expr2) | Devuelve la suma de expr1 y expr2 , o NULL en caso de error. |
try_divide(dividend, divisor) | Devuelve dividend dividido por divisor , o NULL si divisor es 0. |
try_mod(dividend, divisor) | Devuelve el resto después de dividend / divisor , o NULL si divisor es 0.. |
try_multiply(multiplier, multiplicand) | Esta función devuelve el resultado de la multiplicación de los elementos multiplier y multiplicand . Si ocurre un desbordamiento, devuelve el valor NULL . |
try_subtract(expr1, expr2) | Esta función devuelve la resta de los elementos expr2 y expr1 . Si ocurre un desbordamiento, devuelve el valor NULL . |
try_to_number(expr, fmt ) | Devuelve expr convertir a DECIMAL con formato fmt , o NULL si expr no coincide con el formato. |
width_bucket(expr, minExpr, maxExpr, numBuckets) | Devuelve el número de cubos de un valor en un histograma del mismo ancho. |
'zeroifnull(expr)' | Devuelve expr si no NULL es , o 0 de lo contrario. |
Funciones de agregado
Función | Descripción |
---|---|
any(expr) | Devuelve true si al menos un valor de expr en el grupo es true. |
any_value(expr[,ignoreNull]) | Devuelve algún valor de expr para un grupo de filas. |
approx_count_distinct(expr[,relativeSD]) | Devuelve el número estimado de valores distintos en expr dentro del grupo. |
approx_percentile(expr,percentage[,accuracy]) | Devuelve el percentil aproximado del valor expr del grupo. |
approx_top_k(expr[,k[,maxItemsTracked]]) | Devuelve los principales k valores de elementos que se producen con más frecuencia en una expresión expr con sus recuentos aproximados. |
array_agg(expr) | Devuelve una matriz que contiene todos los valores de expr dentro del grupo. |
avg(expr) | Devuelve la media calculada de los valores de un grupo. |
bit_and(expr) | Devuelve el valor AND bit a bit de todos los valores de entrada en el grupo. |
bit_or(expr) | Devuelve el valor OR bit a bit de todos los valores de entrada en el grupo. |
bit_xor(expr) | Devuelve el valor XOR bit a bit de todos los valores de entrada en el grupo. |
bitmap_construct_agg(expr) | Devuelve el bitwise OR de todos los valores de posición de bit en el grupo. entre 0 y 32 767 en un grupo como BINARY . |
bitmap_or_agg(expr) | Devuelve el bitwise OR de todos los BINARY valores de entrada del grupo. |
bool_and(expr) | Devuelve true, si todos los valores de expr son true dentro del grupo. |
bool_or(expr) | Devuelve true si al menos un valor del argumento expr es true dentro del grupo. |
collect_list(expr) | Devuelve una matriz que contiene todos los valores de expr dentro del grupo. |
collect_set(expr) | Devuelve una matriz que contiene todos los valores únicos de expr dentro del grupo. |
corr(expr1,expr2) | Devuelve el coeficiente de correlación de Pearson entre un grupo de pares de números. |
count(*) | Devuelve el número total de filas recuperadas de un grupo, incluidas las filas que contienen NULL. |
count(expr[, …]) | Devuelve el número de filas de un grupo para el que las expresiones proporcionadas no son NULL. |
count_if(expr) | Devuelve el número de valores true para el grupo en expr . |
count_min_sketch(column,epsilon,confidence,seed) | Devuelve un boceto de recuento mínimo de todos los valores del grupo de column con epsilon , confidence y seed . |
covar_pop(expr1,expr2) | Devuelve la covarianza de rellenado de pares de números de un grupo. |
covar_samp(expr1,expr2) | Devuelve la covarianza de muestra de pares de números de un grupo. |
every(expr) | Devuelve true si todos los valores de expr del grupo son true. |
first(expr[,ignoreNull]) | Devuelve el primer valor de expr para un grupo de filas. |
first_value(expr[,ignoreNull]) | Devuelve el primer valor de expr para un grupo de filas. |
histogram_numeric(expr,numBins) | Calcula un histograma en expr con numBins ubicaciones, devolviendo una matriz de pares que representan los centros de las ubicaciones. |
hll_sketch_agg(expr[,lgConfigK]) | Devuelve un croquis de HyperLogLog usado para aproximar un recuento de valores distintos. |
hll_union_agg(expr[,allowDifferentLgConfigK]) | Agrega bocetos de HyperLogLog para un grupo de filas. |
kurtosis(expr) | Devuelve el valor de curtosis calculado a partir de los valores de un grupo. |
last(expr[,ignoreNull]) | Devuelve el último valor de expr para el grupo de filas. |
last_value(expr[,ignoreNull]) | Devuelve el último valor de expr para el grupo de filas. |
max(expr) | Devuelve el valor máximo de expr en un grupo. |
max_by(expr1,expr2) | Devuelve el valor de un elemento expr1 asociado al valor máximo de expr2 en un grupo. |
mean(expr) | Devuelve la media calculada de los valores de un grupo. |
median(expr) | Devuelve el valor de mediana, que se ha calculado a partir de los valores de un grupo. |
min(expr) | Devuelve el valor mínimo de expr en un grupo. |
min_by(expr1, expr2) | Devuelve el valor de un elemento expr1 asociado al valor mínimo de expr2 en un grupo. |
mode(expr [,deterministic]) | Devuelve el valor más frecuente, no NULL , de expr en un grupo. |
percentile(expr, percentage [,frequency]) | Devuelve el valor de percentil exacto de expr en el percentage especificado. |
percentile_approx(expr,percentage[,accuracy]) | Devuelve el percentil aproximado del valor expr del grupo. |
percentile_cont(pct) WITHIN GROUP (ORDER BY key) | Devuelve el percentil interpolado de key dentro del grupo. |
percentile_disc(pct) WITHIN GROUP (ORDER BY key) | Devuelve el percentil discreto dekey dentro del grupo. |
regr_avgx(yExpr, xExpr) | Esta función devuelve la media del elemento xExpr . Esta se calcula a partir de los valores de un grupo donde los elementos xExpr y yExpr emplean el parámetro NOT NULL . |
regr_avgy(yExpr, xExpr) | Esta función devuelve la media del elemento yExpr . Esta se calcula a partir de los valores de un grupo donde los elementos xExpr y yExpr emplean el parámetro NOT NULL . |
regr_count(yExpr, xExpr) | Esta función devuelve el número de pares yExpr y xExpr del grupo cuyos valores no sean NULL. |
regr_intercept(yExpr, xExpr) | Devuelve la intersección de la línea de regresión lineal univariante de un grupo donde xExpr y yExpr son NOT NULL. |
regr_r2(yExpr, xExpr) | Devuelve el coeficiente de determinación a partir de los valores de un grupo donde xExpr y yExpr son NOT NULL. |
regr_slope(yExpr, xExpr) | Devuelve la pendiente de la línea de regresión lineal de pares de valores no null yExpr , xExpr en el grupo. |
regr_sxx(yExpr, xExpr) | Devuelve la suma de cuadrados de los valores xExpr de un grupo, donde xExpr y yExpr son NOT NULL. |
regr_sxy(yExpr, xExpr) | Esta función devuelve la suma de productos de yExpr y xExpr . Esta se calcula a partir de los valores de un grupo donde los elementos xExpr y yExpr emplean el parámetro NOT NULL . |
regr_syy(yExpr, xExpr) | Devuelve la suma de cuadrados de los valores yExpr de un grupo, donde xExpr y yExpr son NOT NULL. |
schema_of_json_agg(json[, options]) | Devuelve el esquema combinado de JSON cadenas en un grupo en formato DDL. |
schema_of_variant_agg(variantExpr) | Devuelve el esquema combinado de todos los valores de VARIANT en un grupo en formato DDL. |
skewness(expr) | Devuelve el valor de asimetría calculado a partir de los valores de un grupo. |
some(expr) | Devuelve true si al menos un valor de expr en un grupo es true . |
std(expr) | Devuelve la desviación estándar de ejemplo calculada a partir de los valores del grupo. |
stddev(expr) | Devuelve la desviación estándar de ejemplo calculada a partir de los valores del grupo. |
stddev(expr) | Devuelve la desviación estándar de población, calculada a partir de los valores de un grupo. |
stddev_samp(expr) | Devuelve la desviación estándar de muestreo, calculada a partir de los valores de un grupo. |
sum(expr) | Devuelve el valor sum calculado a partir de los valores de un grupo. |
try_avg(expr) | Devuelve la media calculada a partir de valores de un grupo, NULL si hay un desbordamiento. |
try_sum(expr) | Devuelve la suma calculada a partir de valores de un grupo, NULL si hay un desbordamiento. |
var_pop(expr) | Devuelve la varianza de población, calculada a partir de los valores de un grupo. |
var_samp(expr) | Devuelve la varianza de muestreo calculada a partir de los valores de un grupo. |
variance(expr) | Devuelve la varianza de muestreo calculada a partir de los valores de un grupo. |
Funciones de ventana de categoría
Función | Descripción |
---|---|
dense_rank() | Devuelve el rango de un valor comparado con todos los valores de la partición. |
ntile(n) | Divide las filas para cada partición de ventana en n cubos que van de 1 a n como máximo. |
percent_rank() | Calcula la clasificación porcentual de un valor dentro de la partición. |
rank() | Devuelve el rango de un valor comparado con todos los valores de la partición. |
row_number() | Asigna un número secuencial único a cada fila, empezando por 1, según el orden de las filas dentro de la partición de ventana. |
Funciones de ventana analítica
Función | Descripción |
---|---|
cume_dist() | Devuelve la posición de un valor con respecto a todos los valores de la partición. |
lag(expr[,offset[,default]]) | Devuelve el valor de expr de una fila anterior dentro de la partición. |
lead(expr[,offset[,default]]) | Devuelve el valor de expr a partir de una fila posterior dentro de la partición. |
nth_value(expr, offset[, ignoreNulls]) | Devuelve el valor de expr en un offset específico de la ventana. |
Funciones de matriz
Función | Descripción |
---|---|
arrayExpr[indexExpr] | Devuelve el elemento en la posición indexExpr de ARRAY arrayExpr . |
aggregate(expr,start,merge[,finish]) | Agrega elementos de una matriz mediante un agregador personalizado. |
array([expr [, …]]) | Devuelve una matriz con los elementos de expr . |
array_append(array, elem) | Devuelve array anexado por elem . |
array_compact(array) | Quita los valores NULL de array . |
array_contains(array,value) | Devuelve true si array contiene value . |
array_distinct(array) | Quita valores duplicados de array . |
array_except(array1,array2) | Devuelve una matriz de los elementos de array1 , pero no en array2 . |
array_insert(array, index, elem) | Devuelve un objeto array expandido donde elem se inserta en la posición index . |
array_intersect(array1,array2) | Devuelve una matriz de los elementos de la intersección de array1 y array2 . |
array_join(array,delimiter[,nullReplacement]) | Concatena los elementos de array . |
array_max(array) | Devuelve el valor máximo de array . |
array_min(array) | Devuelve el valor mínimo de array . |
array_position(array,element) | Devuelve la posición de la primera repetición de element en array . |
array_prepend(array, elem) | Devuelve array antepuesto por elem . |
array_remove(array,element) | Quita todas las repeticiones de element en array . |
array_repeat(element,count) | Devuelve una matriz que contiene element count veces. |
array_size(array) | Esta función devuelve el número de elementos de una array . |
array_sort(array,func) | Devuelve array ordenado según func . |
array_union(array1,array2) | Devuelve una matriz de los elementos de la unión de array1 y array2 sin duplicados. |
arrays_overlap(array1, array2) | Devuelve true si la intersección de array1 y array2 no está vacía. |
arrays_zip(array1 [, …]) | Devuelve una matriz combinada de estructuras, en la que la enésima estructura contiene todos los enésimos valores de matrices de entrada. |
cardinality(expr) | Devuelve el tamaño de expr . |
concat(expr1, expr2 [, …]) | Devuelve la concatenación de los argumentos. |
element_at(arrayExpr, index) | Devuelve el elemento de un arrayExpr en index . |
exists(expr, pred) | Devuelve true si pred es true para cualquier elemento de expr . |
explode(collection) | Devuelve filas mediante la anulación del anidamiento de collection . |
explode_outer(collection) | Devuelve filas mediante la anulación del anidamiento de collection con semántica externa. |
filter(expr,func) | Filtra la matriz en expr mediante la función func . |
flatten(arrayOfArrays) | Transforma una matriz de matrices en una sola matriz. |
forall(expr, predFunc) | Prueba si predFunc contiene todos los elementos de la matriz. |
get(arrayExpr, index) | Devuelve el elemento de una instrucción arrayExpr en index , a partir de 0 . |
inline(expr) | Expande una matriz de estructuras en una tabla. |
inline_outer(expr) | Expande una matriz de estructuras en una tabla con semántica externa. |
posexplode(expr) | Devuelve filas mediante la anulación de la anidación de la matriz con numeración de posiciones. |
posexplode_outer(expr) | Devuelve filas anulando la anidación con numeración de posiciones mediante semántica OUTER . |
reduce(expr,start,merge[,finish]) | Agrega elementos de una matriz mediante un agregador personalizado. |
reverse(array) | Devuelve una cadena invertida o una matriz con los elementos en orden inverso. |
sequence(start,stop,step) | Genera una matriz de elementos de start a stop (incluidos), con incrementos de step . |
shuffle(array) | Devuelve una permutación aleatoria de la matriz en expr . |
size(expr) | Devuelve la cardinalidad de expr . |
slice(expr,start,length) | Devuelve un subconjunto de una matriz. |
sort_array(expr[,ascendingOrder]) | Devuelve la matriz de expr ordenada. |
transform(expr, func) | Transforma los elementos de una matriz en expr mediante la función func . |
try_element_at(arrayExpr, index) | Devuelve el elemento de arrayExpr correspondiente a index o NULL si index está fuera del límite. |
zip_with(expr1, expr2, func) | Combina las matrices de expr1 y expr2 , en cuanto a elementos, en una sola matriz mediante func . |
Funciones de asignación
Función | Descripción |
---|---|
mapExpr[keyExpr] | Devuelve el valor en keyExpr de MAP mapExpr . |
cardinality(expr) | Devuelve el tamaño de expr . |
element_at(mapExpr, key) | Devuelve el valor de mapExpr para key . |
explode(expr) | Devuelve filas mediante la anulación del anidamiento de expr . |
explode_outer(expr) | Devuelve filas mediante la anulación del anidamiento de expr con semántica externa. |
map([{key1, value1}[, …]]) | Crea una asignación con los pares clave-valor especificados. |
map_concat([expr1 [, …]]) | Devuelve la unión de todas las expresiones de asignación de expr . |
map_contains_key(map, key) | Esta función devuelve el valor true si el elemento map contiene un elemento key . De lo contrario, devuelve el valor false . |
map_entries(map) | Devuelve una matriz desordenada de todas las entradas de map . |
map_filter(expr, func) | Filtra las entradas del mapa de expr mediante la función func . |
map_from_arrays(keys, values) | Crea una asignación con un par de matrices keys y values . |
map_from_entries(expr) | Crea una asignación generada a partir de la matriz de entradas especificada. |
map_keys(map) | Devuelve una matriz desordenada que contiene las claves de map . |
map_values(map) | Devuelve una matriz desordenada que contiene los valores de map . |
map_zip_with(map1, map2, func) | Combina map1 y map2 en una sola asignación. |
size(expr) | Devuelve la cardinalidad de expr . |
str_to_map(expr[,pairDelim[,keyValueDelim]]) | Devuelve un mapa después de dividir expr en pares clave-valor mediante delimitadores. |
transform_keys(expr, func) | Transforma las claves de un mapa en expr mediante la función func . |
transform_values(expr, func) | Transforma los valores de una asignación en expr mediante la función func . |
try_element_at(mapExpr, key) | Devuelve el valor de mapExpr correspondiente a key o NULL si key no existe. |
Funciones de fecha, marca de tiempo e intervalo
Para obtener información sobre los formatos de fecha y marca de tiempo, consulte Patrones de fecha y hora.
Función | Descripción |
---|---|
intervalExpr / divisor | Devuelve el intervalo dividido por divisor . |
- intervalExpr | Devuelve el valor negado de intervalExpr . |
intervalExpr1 - intervalExpr2 | Devuelve la resta de intervalExpr2 de intervalExpr1 . |
datetimeExpr1 - datetimeExpr2 | Devuelve la resta de datetimeExpr2 de datetimeExpr1 . |
+ intervalExpr | Devuelve el valor de intervalExpr . |
intervalExpr1 + intervalExpr2 | Devuelve la suma de intervalExpr1 y intervalExpr2 . |
intervalExpr * multiplicand | Devuelve intervalExpr multiplicado por multiplicand . |
abs(expr) | Devuelve el valor absoluto del valor de intervalo en expr . |
add_months(startDate,numMonths) | Devuelve la fecha que es numMonths después de startDate . |
curdate() | Devuelve la fecha actual al principio de la evaluación de consultas. |
current_date() | Devuelve la fecha actual al principio de la evaluación de consultas. |
current_timestamp() | Devuelve la marca de tiempo actual al principio de la evaluación de consultas. |
current_timezone() | Devuelve la zona horaria local de la sesión actual. |
date(expr) | Convierte el valor expr en DATE. |
date_add(startDate,numDays) | Devuelve la fecha numDays después de startDate . |
date_add(unit, value, expr) | Agrega value unit s a una marca de tiempo expr . |
date_diff(unit, start, stop) | Esta función devuelve la diferencia entre dos marcas de tiempo medida en unidades unit . |
date_format(expr,fmt) | Convierte una marca de tiempo en una cadena con el formato fmt . |
date_from_unix_date(days) | Crea una fecha a partir del número de días desde 1970-01-01 . |
date_part(field,expr) | Extrae una parte de la fecha, marca de tiempo o intervalo. |
date_sub(startDate,numDays) | Devuelve la fecha numDays antes de startDate . |
date_trunc(unit,expr) | Devuelve la marca de tiempo truncada en la unidad especificada en unit . |
dateadd(startDate,numDays) | Devuelve la fecha numDays después de startDate . |
dateadd(unit, value, expr) | Agrega value unit s a una marca de tiempo expr . |
datediff(endDate,startDate) | Devuelve el número de días de startDate a endDate . |
datediff(unit, start, stop) | Esta función devuelve la diferencia entre dos marcas de tiempo medida en unidades unit . |
day(expr) | Devuelve el día del mes de la fecha o marca de tiempo. |
dayofmonth(expr) | Devuelve el día del mes de la fecha o marca de tiempo. |
dayofweek(expr) | Devuelve el día de la semana de la fecha o marca de tiempo. |
dayofyear(expr) | Devuelve el día del año de la fecha o marca de tiempo. |
divisor div dividend | Devuelve la parte entera de la división del intervalo divisor por el intervalo dividend . |
extract(field FROM source) | Devuelve field de source . |
from_unixtime(unixTime,fmt) | Devuelve unixTime en fmt . |
from_utc_timestamp(expr,timezone) | Devuelve la marca de tiempo en UTC para una marca de expr tiempo en timeZone . |
getdate() | Devuelve la marca de tiempo actual al principio de la evaluación de consultas. |
hour(expr) | Devuelve el componente de hora de una marca de tiempo. |
last_day(expr) | Devuelve el último día del mes al que pertenece la fecha. |
make_date(year,month,day) | Crea una fecha a partir de los campos year , month y day . |
make_dt_interval([days[, hours[, mins[, secs]]]]) | Crea un intervalo de tiempo de día a partir de days , hours , mins y secs . |
make_interval(years, months, weeks, days, hours, mins, secs) | En desuso: crea un intervalo a partir de years , months , weeks , days , hours , mins y secs . |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | Crea una marca de tiempo a partir de los campos year , month , day , hour , min , sec y timezone . |
make_ym_interval([years[, months]]) | Crea un intervalo de año-mes a partir de years y months . |
minute(expr) | Devuelve el componente de minuto de la marca de tiempo en expr . |
month(expr) | Devuelve el componente mes de la marca de tiempo en expr . |
months_between(expr1,expr2[,roundOff]) | Devuelve el número de meses transcurridos entre fechas o marcas de tiempo en expr1 y expr2 . |
next_day(expr,dayOfWeek) | Devuelve la primera fecha que es posterior a expr y se denomina como en dayOfWeek . |
now() | Devuelve la marca de tiempo actual al principio de la evaluación de consultas. |
quarter(expr) | Devuelve el trimestre del año para expr en el intervalo de 1 a 4. |
second(expr) | Devuelve el componente de segundos de la marca de tiempo en expr . |
session_window(expr, gpDuration) | Crea una ventana de sesión sobre una expresión de marca de tiempo. |
sign(expr) | Devuelve -1.0, 0.0 o 1.0, según el intervalo expr sea negativo, 0 o positivo. |
signum(expr) | Devuelve -1.0, 0.0 o 1.0, según el intervalo expr sea negativo, 0 o positivo. |
timediff(unit, start, stop) | Esta función devuelve la diferencia entre dos marcas de tiempo medida en unidades unit . |
timestamp(expr) | Convierte expr en TIMESTAMP . |
timestamp_micros(expr) | Crea una marca de tiempo de expr microsegundos desde la época UTC. |
timestamp_millis(expr) | Crea una marca de tiempo de expr milisegundos desde la época UTC. |
timestamp_seconds(expr) | Crea una marca de tiempo de expr segundos desde la época UTC. |
timestampadd(unit, value, expr) | Agrega value unit s a una marca de tiempo expr . |
timestampdiff(unit, start, stop) | Esta función devuelve la diferencia entre dos marcas de tiempo medida en unidades unit . |
to_date(expr[,fmt]) | Devuelve la conversión de expr a una fecha mediante un formato opcional. |
to_timestamp(expr[,fmt]) | Devuelve la conversión expr a una marca de tiempo mediante un formato opcional. |
to_unix_timestamp(expr[,fmt]) | Devuelve la marca de tiempo en expr como marca de tiempo UNIX. |
to_utc_timestamp(expr,timezone) | Devuelve la marca de tiempo en UTC para una marca de expr tiempo en timezone . |
trunc(expr, fmt) | Devuelve una fecha con la parte de la fecha truncada a la unidad especificada por el modelo de formato fmt . |
try_add(expr1, expr2) | Devuelve la suma de expr1 y expr2 , o NULL en caso de error. |
try_divide(dividend, divisor) | Devuelve dividend dividido por divisor o NULL si divisor es 0. |
try_multiply(multiplier, multiplicand) | Esta función devuelve el resultado de la multiplicación de los elementos multiplier y multiplicand . Si ocurre un desbordamiento, devuelve el valor NULL . |
try_subtract(expr1, expr2) | Esta función devuelve la resta de los elementos expr2 y expr1 . Si ocurre un desbordamiento, devuelve el valor NULL . |
try_to_timestamp(expr[,fmt]) | Devuelve la conversión expr a una marca de tiempo mediante un formato opcional, o NULL si se produce un error en la conversión. |
unix_date(expr) | Devuelve el número de días desde 1970-01-01 . |
unix_micros(expr) | Devuelve el número de microsegundos desde 1970-01-01 00:00:00 UTC . |
unix_millis(expr) | Devuelve el número de milisegundos desde 1970-01-01 00:00:00 UTC . |
unix_seconds(expr) | Devuelve el número de segundos desde 1970-01-01 00:00:00 UTC . |
unix_timestamp([expr[, fmt]]) | Devuelve la marca de tiempo UNIX de la hora actual o especificada. |
weekday(expr) | Devuelve el día de la semana de expr . |
weekofyear(expr) | Devuelve la semana del año de expr . |
year(expr) | Devuelve el componente del año de expr . |
window(expr, width[, step[, start]]) | Crea una ventana deslizante basada en saltos sobre una expresión de marca de tiempo. |
window_time(window) | Devuelve la hora de finalización inclusiva de un período de tiempo generado por las funciones window o session_window. |
Funciones geoespaciales H3
Para obtener información sobre las funciones geoespaciales H3, consulte Funciones geoespaciales H3.
Funciones y constructores de conversión
Para obtener información sobre la conversión entre tipos, consulte la función cast y la función try_cast.
Función | Descripción |
---|---|
array([expr [, …]]) | Devuelve una matriz con los elementos de expr . |
bigint(expr) | Convierte el valor expr en BIGINT . |
binary(expr) | Convierte el valor de expr en BINARY . |
boolean(expr) | Convierte expr en BOOLEAN . |
cast(expr AS type) | Convierte el valor expr al tipo de datos de destino type . |
expr :: type | Convierte el valor expr al tipo de datos de destino type . |
date(expr) | Convierte el valor expr en DATE . |
decimal(expr) | Convierte el valor expr en DECIMAL . |
double(expr) | Convierte el valor expr en DOUBLE . |
float(expr) | Convierte el valor expr en FLOAT . |
int(expr) | Convierte el valor expr en INTEGER . |
make_date(year,month,day) | Crea una fecha a partir de los campos year , month y day . |
make_dt_interval([days[, hours[, mins[, secs]]]]) | Crea un intervalo de tiempo de día a partir de days , hours , mins y secs . |
make_interval(years, months, weeks, days, hours, mins, secs) | Crea un intervalo a partir de years , months , weeks , days , hours , mins y secs . |
make_timestamp(year,month,day,hour,min,sec[,timezone]) | Crea una marca de tiempo a partir de los campos year , month , day , hour , min , sec y timezone . |
make_ym_interval([years[, months]]) | Crea un intervalo de año-mes a partir de years y months . |
map([{key1, value1} [, …]]) | Crea una asignación con los pares clave-valor especificados. |
named_struct({name1, val1} [, …]) | Crea una estructura con los nombres de campo y valores especificados. |
smallint(expr) | Convierte el valor expr en SMALLINT . |
string(expr) | Convierte el valor expr en STRING . |
struct(expr1 [, …]) | Crea un valor STRUCT con los valores de campo especificados. |
tinyint(expr) | Convierte expr en TINYINT . |
timestamp(expr) | Convierte expr en TIMESTAMP . |
to_char(expr, fmt) | Devuelve expr convertido a STRING utilizando el formato fmt ". |
to_date(expr[,fmt]) | Devuelve la conversión de expr a una fecha mediante un formato opcional. |
to_number(expr, fmt) | Devuelve expr convertido a DECIMA L utilizando el formato fmt . |
to_timestamp(expr[,fmt]) | Devuelve la conversión expr a una marca de tiempo mediante un formato opcional. |
to_varchar(expr, fmt) | Devuelve expr convertido a STRING utilizando el formato fmt ". |
try_cast(expr AS type) | Convierte el valor expr en el tipo de datos de destino de type de forma segura. |
try_to_number(expr, fmt) | Devuelve la conversión de expr a DECIMAL mediante el formato fmt o NULL , si expr no es válido. |
Funciones CSV y Avro
Función | Descripción |
---|---|
from_avro(avroBin, jsonSchema[, options]) | Devuelve un valor de estructura basado en avroBin y jsonSchema . |
from_csv(csvStr, schema[, options]) | Devuelve un valor de estructura con csvStr y schema . |
schema_of_csv(csv[, options]) | Devuelve el esquema de una cadena CSV en formato DDL. |
to_avro(expr[, options]) | Devuelve un valor binario avro con el valor de estructura especificado. |
to_csv(expr[, options]) | Devuelve una cadena CSV con el valor de estructura especificado. |
Funciones JSON
Función | Descripción |
---|---|
jsonStr : jsonPath | Devuelve los campos extraídos de jsonStr . |
from_json(jsonStr, schema[, options]) | Devuelve un valor de estructura con jsonStr y schema . |
get_json_object(expr, path) | Extrae un objeto JSON de path . |
json_array_length(jsonArray) | Devuelve el número de elementos de la matriz JSON más externa. |
json_object_keys(jsonObject) | Devuelve todas las claves del objeto JSON más externo como una matriz. |
json_tuple(jsonStr, path1 [, …]) | Devuelve múltiples objetos JSON como una tupla. |
parse_json(jsonStr) | Devuelve un valor de VARIANT del jsonStr . |
schema_of_json(jsonStr[, options]) | Devuelve el esquema de una cadena JSON en formato DDL. |
schema_of_json_agg(jsonStr[, options]) | Devuelve el esquema combinado de JSON cadenas en un grupo en formato DDL. |
to_json(expr[, options]) | Devuelve una cadena JSON con el STRUCT o VARIANT especificado en expr . |
Funciones VARIANT
Función | Descripción |
---|---|
variantExpr : jsonPath | Devuelve los campos extraídos del variantExpr mediante la ruta de acceso JSON. |
is_variant_null(variantExpr) | Comprueba si variantExpr es un VARIANT codificado NULL . |
parse_json(jsonStr) | Devuelve un valor de VARIANT del jsonStr . |
schema_of_variant(variantExpr) | Devuelve el esquema de una expresión VARIANT en formato DDL. |
schema_of_variant_agg(variantExpr) | Devuelve el esquema combinado de todos los valores de VARIANT en un grupo en formato DDL. |
to_json(expr[, options]) | Devuelve una cadena JSON con el STRUCT o VARIANT especificado en expr . |
try_parse_json(jsonStr) | Devuelve un valor VARIANT del jsonStr si es posible. Si no es posible, se devuelve NULL . |
try_variant_get(variantExpr,path,type) | Extrae un valor de tipo type de variantExpr , especificado por path , o NULL si no es posible convertir al tipo de destino. |
variant_explode(variantExpr) | Devuelve un conjunto de filas anulando el anidamiento de variantExpr . |
variant_explode_outer(variantExpr) | Devuelve un conjunto de filas anulando el anidamiento de variantExpr mediante semántica externa. |
variant_get(variantExpr,path,type) | Extrae un valor de tipo type de variantExpr , especificado por path . |
Funciones XPath y XML
Función | Descripción |
---|---|
from_xml(xmlStr, schema[, options]) | Devuelve un valor de estructura analizado desde xmlStr mediante schema . |
schema_of_xml(xmlStr[, options]) | Devuelve el esquema de una cadena XML en formato DDL. |
xpath(xml, xpath) | Devuelve valores dentro de los nodos de xml que coinciden con xpath . |
xpath_boolean(xml, xpath) | Devuelve true si la expresión xpath se evalúa como true , o si se encuentra un nodo coincidente en xml . |
xpath_double(xml, xpath) | Devuelve un valor DOUBLE de un documento XML. |
xpath_float(xml, xpath) | Devuelve un valor FLOAT de un documento XML. |
xpath_int(xml, xpath) | Devuelve un valor INTEGER de un documento XML. |
xpath_long(xml, xpath) | Devuelve un valor BIGINT de un documento XML. |
xpath_number(xml, xpath) | Devuelve un valor DOUBLE de un documento XML. |
xpath_short(xml, xpath) | Devuelve un valor SHORT de un documento XML. |
xpath_string(xml, xpath) | Devuelve el contenido del primer nodo XML que coincide con la expresión XPath. |
Funciones de IA
Función | Descripción |
---|---|
ai_analyze_sentiment(content) | Devuelve la opinión de un texto. |
ai_classify(content, labels) | Clasifica el contenido proporcionado en una de las etiquetas proporcionadas. |
ai_extract(content, labels) | Extrae las entidades especificadas por las etiquetas de un texto determinado. |
ai_fix_grammar(content) | Corrige errores gramaticales de un texto determinado. |
ai_forecast(observed, time_col) | Extrapola datos de series temporales en el futuro. |
ai_gen(content) | Invoca un modelo de IA generativo de última generación de las API de modelo de Databricks Foundation para responder al mensaje proporcionado por el usuario. |
ai_generate_text(prompt, modelName[, param1, value1] […]) | En desuso: devuelve el texto generado por un modelo de lenguaje grande (LLM) seleccionado según el mensaje. |
ai_mask(content, labels) | Enmascara las entidades especificadas dentro de un texto determinado. |
ai_query(endpointName, request, returnType) | Invoca un punto final existente de Mosaic AI Model Serving, y analiza y devuelve su respuesta. |
ai_similarity(strExpr1, strExpr2) | Compara dos cadenas y calcula la puntuación de similitud semántica. |
ai_summarize(content[, max_words]) | Genera un resumen de un texto determinado. |
ai_translate(content, to_lang) | Traduce texto a un idioma de destino especificado. |
vector_search(index, query, num_results) | Consulte un índice de Vector de búsqueda de IA de Mosaic usando SQL. |
Funciones de lectura
Función | Descripción |
---|---|
read_files(path, [optionKey => optionValue] [, …]) | Lee los archivos de datos en el almacenamiento en la nube y los devuelve en formato tabular. |
read_kafka([optionKey => optionValue] [, …]) | Lee registros de un clúster de Apache Kafka y los devuelve en formato tabular. |
read_kinesis({parameter => value} [, …]) | Devuelve una tabla con registros leídos de Kinesis de una o varias secuencias. |
read_pubsub([parameter => value] [, …]) | Función con valores de tabla para leer registros de Pub/Sub de un tema. |
read_pulsar({optionKey => optionValue} [, …]) | Devuelve una tabla con los registros leídos desde Pulsar. |
read_state_metadata(path) | Devuelve una tabla con filas que representan los metadatos de un estado de consulta de streaming. |
read_statestore(path [, option_key => option_value] […]) | Devuelve registros del almacén de estado de las consultas de streaming. |
Funciones varias
Función | Descripción |
---|---|
assert_true(expr) | Devuelve un error si expr no es true. |
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END | Devuelve resN para el primer optN que es igual a expr , o def si ninguno coincide. |
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END | Devuelve resN para el primer condN que se evalúa como true, o def si no se encuentra ninguno. |
cloud_files_state( { TABLE(table) | checkpoint } ) | Devuelve el estado de nivel de archivo de un origen cloud_files del cargador automático. |
coalesce(expr1, expr2 [, …]) | Devuelve el primer argumento que no es NULL. |
cube (expr1 [, …]) | Crea un cubo multidimensional con las columnas de expresión especificadas. |
current_catalog() | Devuelve el catálogo actual. |
current_database() | Devuelve el esquema actual. |
current_metastore() | Devuelve el identificador de metastore de Unity Catalog actual. |
current_recipient(key) | Devuelve una propiedad para el destinatario actual en una vista compartida con Delta Sharing. |
current_schema() | Devuelve el esquema actual. |
current_user() | Devuelve el usuario que ejecuta la instrucción. |
current_version() | Devuelve la versión actual de Azure Databricks. |
decode(expr, { key, value } [, …] [,defValue]) | Devuelve el valor que coincide con la clave. |
elt(index, expr1 [, …] ) | Devuelve la enésima expresión. |
equal_null(expr1, expr2) | Devuelve true si expr1 es igual a expr2 o ambas expresiones son NULL , o false de lo contrario. |
event_log( { TABLE(table) | pipeline_id } ) | Devuelve una tabla del historial de actualización de una vista materializada, una tabla de streaming o una canalización DLT. |
greatest(expr1, expr2 [, …]) | Devuelve el valor más grande de todos los argumentos, omitiendo los valores NULL. |
grouping(col) | Indica si una columna especificada en GROUPING SET , ROLLUP o CUBE representa un subtotal. |
grouping_id([col1 [, …]]) | Devuelve el nivel de agrupación de un conjunto de columnas. |
hash(expr1 [, …]) | Devuelve un valor hash de los argumentos. |
hll_sketch_estimate(expr) | Calcula el número de valores distintos recopilados en un boceto de HyperLogLog. |
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) | Combina dos bocetos de HyperLogLog. |
java_method(class, method[, arg1 [, …]]) | Llama a un método con reflexión. |
if(cond, expr1, expr2) | Devuelve expr1 si cond es true ; de lo contrario, expr2 . |
iff(cond, expr1, expr2) | Devuelve expr1 si cond es true ; de lo contrario, expr2 . |
ifnull(expr1, expr2) | Devuelve expr2 si expr1 es NULL ; de lo contrario, expr1 . |
input_file_block_length() | Devuelve la longitud en bytes del bloque que se lee. |
input_file_block_start() | Devuelve el desplazamiento inicial en bytes del bloque que se está leyendo. |
input_file_name() | Devuelve el nombre del archivo que se está leyendo, o una cadena vacía si no está disponible. |
is_account_group_member(grupo) | Devuelve true si el usuario actual es miembro de un grupo en el nivel de cuenta. |
is_member(group) | Devuelve true si el usuario actual es miembro de un grupo en el nivel de área de trabajo. |
isnull(expr) | Devuelve true si expr es NULL . |
isnotnull(expr) | Devuelve true si expr no es NULL . |
least(expr1, expr2 [, …]) | Devuelve el valor más pequeño de todos los argumentos, omitiendo los valores NULL. |
list_secrets([scopeStr]) | Devuelve las claves en todo o un ámbito que el usuario está autorizado a ver del servicio secreto de Databricks. |
luhn_check(numStr) | Devuelve true si numStr pasa la comprobación del algoritmo luhn. |
monotonically_increasing_id() | Devuelve un aumento monótono de enteros de 64 bits. |
nullif(expr1, expr2) | Devuelve NULL si expr1 es igual a expr2 , de lo contrario, devuelve expr1 . |
nvl(expr1, expr2) | Devuelve expr2 si expr1 es NULL ; de lo contrario, expr1 . |
nvl2(expr1, expr2, expr3) | Devuelve expr2 si expr1 no es NULL ; de lo contrario, expr3 . |
raise_error(expr) | Produce una excepción con expr como mensaje. |
range(end) | Devuelve una tabla de valores dentro de un intervalo especificado. |
range(start, end [, step [, numParts]]) | Devuelve una tabla de valores dentro de un intervalo especificado. |
reflect(class, method[, arg1 [, …]]) | Llama a un método con reflexión. |
secret(scope, key) | Extrae un valor de secreto con los scope y key obtenidos del Servicio de secretos de Databricks. |
session_user() | Devuelve el usuario conectado a Azure Databricks. |
spark_partition_id() | Devuelve el identificador de la partición actual. |
sql_keywords() | Devuelve el conjunto de palabras clave de SQL en Azure Databricks. |
stack(numRows, expr1 [, …]) | Separa expr1 , …, exprN en numRows filas. |
table_changes(table_str, start [, end]) | Devuelve un registro de cambios en una tabla de Delta Lake con la fuente de distribución de datos de cambios habilitada. |
try_reflect(class, method[, arg1 [, …]]) | Llama a un método con reflexión y devuelve si se produce un error NULL en el método. |
try_secret(scope, key) | Extrae un valor de secreto con los scope y key obtenidos del servicio de secretos de Databricks o NULL si la clave no se puede recuperar. |
typeof(expr) | Devuelve una cadena de tipo con formato DDL para el tipo de datos de expr . |
user() | Devuelve el usuario que ejecuta la instrucción. |
uuid() | Devuelve una cadena de identificador único universal (UUID). |
window(expr, width[, step [, start]]) | Crea una ventana deslizante basada en saltos sobre una expresión de marca de tiempo. |
xxhash64(expr1 [, …]) | Devuelve un valor hash de 64 bits de los argumentos. |
version() | Devuelve la versión de Apache Spark. |