기본 제공 함수
적용 대상: Databricks SQL Databricks Runtime
이 문서에서는 문자열 및 이진 유형, 숫자 스칼라, 집계, 창, 배열, 지도, 날짜 및 타임스탬프, 캐스팅, CSV 데이터, JSON 데이터, XPath 조작 및 기타 기타 함수에 대한 기본 제공 연산자 및 함수에 대한 링크와 설명을 설명합니다.
정보 로깅 수준이 비활성화되어 있는 경우 클라이언트가 서버와 상태를 올바르게 동기화할 수 없는 오류를 수정했습니다. 사용자 정의 함수(UDF)란 무엇인가요?을 참조하세요.
또한 다음을 참조하세요.
연산자 및 조건자
서로에 대해 연산자를 구문 분석하는 방법에 대한 자세한 내용은 연산자 우선 순위를 참조하세요.
연산자 | 구문 | 설명 |
---|---|---|
& | expr1 & expr2 |
AND 및 expr1 의 비트 expr2 을 반환합니다. |
and | expr1 and expr2 |
AND 과 expr1 의 논리적 expr2 을 반환합니다. |
* | multiplier * multiplicand |
multiplier 에 multiplicand 를 곱한 값을 반환합니다. |
!= | expr1 != expr2 |
expr1 이 expr2 와 같지 않으면 true를 반환하고, 그렇지 않으면 false 를 반환합니다. |
! | !expr |
부울 식의 논리적 NOT 을 반환합니다. |
between | expr1 [not] between expr2 and expr2 |
expr1 이 expr2 보다 크거나 같은지, expr3 보다 작거나 같은지 테스트합니다. |
[ ] | arrayExpr [ indexExpr ] |
indexExpr
ARRAY 의 요소 arrayExpr nd를 반환합니다. |
[ ] | mapExpr [ keyExpr ] |
keyExpr
MAP 의 mapExpr 에서 값을 반환합니다. |
^ | expr1 ^ expr2 |
OR (XOR) 및 expr1 의 배타적 비트 expr2 을 반환합니다. |
: | jsonStr : jsonPath |
jsonStr 에서 추출된 필드를 반환합니다. |
:: | expr :: type |
값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
?:: | expr ?:: type |
가능하면 목표 데이터 유형 expr 에 값 type 를 캐스팅하고 그렇지 않으면 NULL 를 반환합니다. |
div | dividend div divisor |
dividend 를 divisor 로 나눈 값의 정수 부분을 반환합니다. |
. | mapExpr . keyIdentifier |
MAP 에서 keyIdentifier 값을 반환합니다. |
. | structExpr . fieldIdentifier |
STRUCT 에서 fieldIdentifier 필드를 반환합니다. |
== | expr1 == expr2 |
true 이 expr1 와 같으면 expr2 을 반환하고, 그렇지 않으면 false 을 반환합니다. |
= | expr1 = expr2 |
true 이 expr1 와 같으면 expr2 을 반환하고, 그렇지 않으면 false 을 반환합니다. |
>= | expr1 >= expr2 |
true 이 expr1 보다 크거나 같으면 expr2 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
> | expr1 > expr2 |
true 이 expr1 보다 크면 expr2 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
exists | exists(query) |
query 에서 하나 이상의 행을 반환하면 true를 반환하고, 그렇지 않으면 false를 반환합니다. |
ilike | str [not] ilike (pattern[ESCAPE escape]) |
str 이 대/소문자를 구분하지 않고 pattern 과 escape 가 일치하지 않으면 true를 반환합니다. |
ilike | str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) |
str 이 대/소문자를 구분하지 않고 일부/모든 패턴과 일치하지 않으면 true를 반환합니다. |
in | elem [not] in (expr1[, ...]) |
true 이 elem 과 같지 않으면 exprN 를 반환합니다. |
in | elem [not] in (query) |
true 이 elem 의 행과 같지 않으면 query 를 반환합니다. |
is distinct | expr1 is [not] distinct from expr2 |
인수에 서로 다른 valueswhereNULL 가 (없는지) 있는지 여부를 테스트하는 것은 비교 가능한 values으로 간주됩니다. |
is false | expr is [not] false |
expr 이 false 인지 여부를 테스트합니다. |
is null | expr is [not] null |
true 이 expr 인지 여부에 관계없이 NULL 를 반환합니다. |
is true | expr is [not] true |
expr 이 true 인지 여부를 테스트합니다. |
like | str [not] like (pattern[ESCAPE escape]) |
str 이 pattern 과 escape 가 일치하지 않으면 true를 반환합니다. |
like | str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) |
str 이 일부/모든 패턴과 일치하지 않으면 true를 반환합니다. |
<=> | expr1 <=> expr2 |
null이 아닌 피연산자의 경우 EQUAL(=) 과 동일한 결과를 반환하지만, 둘 다 true 이면 NULL 를 반환하고 둘 중 하나가 false 이면 NULL 를 반환합니다. |
<= | expr1 <= expr2 |
true 이 expr1 보다 작거나 같으면 expr2 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
<> | expr1 <> expr2 |
true 이 expr1 와 같지 않으면 expr2 를 반환하고, 그렇지 않으면 false 를 반환합니다. |
< | expr1 < expr2 |
true 이 expr1 보다 작으면 expr2 를 반환하고 그렇지 않으면 false 를 반환합니다. |
- | expr1 - expr2 |
expr2 에서 expr1 를 뺀 값을 반환합니다. |
not | not expr |
부울 식의 논리적 NOT 을 반환합니다. |
or | expr1 or expr2 |
OR 과 expr1 의 논리적 expr2 을 반환합니다. |
% | dividend % divisor |
dividend
/
divisor 이후의 나머지를 반환합니다. |
|| | expr1 \|\| expr2 |
expr1 및 expr2 의 연결을 반환합니다. |
| | expr1 \| expr2 |
OR 및 expr1 의 비트 expr2 을 반환합니다. |
+ | expr1 + expr2 |
expr1 및 expr2 의 합계를 반환합니다. |
regexp | str [not] regexp regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
regexp_like | str [not] regexp_like regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
rlike | str [not] rlike regex |
str 이 regex 와 일치하지 않으면 true를 반환합니다. |
/ | dividend / divisor |
dividend 로 나눈 divisor 값을 반환합니다. |
~ | ~ expr |
NOT 의 비트 단위 expr 을 반환합니다. |
연산자 우선 순위
우선 순위 | 연산자 |
---|---|
1 |
: , :: , ?:: [ ] |
2 |
- (단항), + (단항), ~ |
3 |
* , / , % div |
4 |
+ , , - \|\| |
5 | & |
6 | ^ |
7 | \| |
8 |
= ,== , <=> , <> , != , < <= , > >= |
9 |
not , exists |
10 |
between , in , rlike , regexp , ilike , like , is [not] [NULL, true, false] is [not] distinct from |
11 | and |
12 | or |
문자열 및 이진 함수
함수 | 설명 |
---|---|
expr1 || expr2 |
expr1 및 expr2 의 연결을 반환합니다. |
aes_decrypt(expr, key[, mode[, padding[, aad]]]) | AES 암호화를 사용하여 expr 이진 파일의 암호를 해독합니다. |
aes_encrypt(expr, key[, mode[, padding[, iv[, aad]]]]) | AES 암호화를 사용하여 expr 이진 파일을 암호화합니다. |
ascii(str) |
str 의 첫 번째 문자에 대한 ASCII 코드 포인트를 반환합니다. |
base64(expr) |
expr 을 기본 64 문자열로 변환합니다. |
bin(expr) |
expr 의 이진 표현을 반환합니다. |
binary(expr) |
expr 의 값을 BINARY 로 캐스팅합니다. |
bit_length(expr) | 문자열 데이터의 비트 길이 또는 이진 데이터의 비트 수를 반환합니다. |
bitmap_count(expr) | 비트맵을 나타내는 set 문자열에서 BINARY 비트 수를 반환합니다. |
btrim(str [, trimStr]) | 선행 및 후행 문자가 제거된 str 을 반환합니다. |
char(expr) | 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다. |
char_length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
character_length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
charindex(substr, str[, pos]) |
substr 위치 다음의 str 에서 pos 이 처음 나타나는 위치를 반환합니다. |
chr(expr) | 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다. |
strExpr collate collationName | 명시적 정렬 collationName 을(를) strExpr 에 연결합니다. |
데이터 정렬 [for](strExpr) |
strExpr 에 부착된 콜레이션을 반환합니다. |
concat(expr1, expr2[, …]) | 인수의 연결을 반환합니다. |
concat_ws(sep[, expr1[, …]]) |
sep 로 구분된 연결 문자열을 반환합니다. |
contains(expr, subExpr) |
true
expr 또는 STRING 에 BINARY 가 포함되어 있으면 subExpr 를 반환합니다. |
crc32(expr) |
expr 의 순환 중복 검사 값을 반환합니다. |
decode(expr, charSet) | 문자 expr 인코딩 set사용하여 이진 charSet 문자열로 변환합니다. |
encode(expr, charSet) |
charSet 문자 인코딩을 사용하여 문자열의 이진 표현을 반환합니다. |
endswith(expr, endExpr) |
true
expr 또는 STRING 가 BINARY 로 끝나면 endExpr 를 반환합니다. |
find_in_set(searchExpr, sourceExpr) | 문자열의 쉼표로 구분된 list 내에서 문자열의 위치를 반환합니다. |
format_number(expr, scale) |
expr 의 형식이 #,###,###.## 소수 자릿수로 반올림되는 scale 과 같습니다. |
format_number(expr, fmt) |
expr 의 형식이 fmt 과 같습니다. |
format_string(strfmt[, obj1 [, …]]) | printf 스타일 형식 문자열의 형식 문자열을 반환합니다. |
hex(expr) |
expr 을 16진수로 변환합니다. |
str ilike (pattern[ESCAPE escape]) |
str 이 대/소문자를 구분하지 않고 pattern 가 있는 escape 과 일치하면 true를 반환합니다. |
initcap(expr) | 각 단어의 첫 글자가 대문자인 expr 을 반환합니다. |
instr(str, substr) |
substr 에서 str 의 첫 번째 항목에 대한 인덱스(1부터 시작)를 반환합니다. |
lcase(expr) | 모든 문자가 소문자로 변경된 expr 을 반환합니다. |
left(str, len) |
len 에서 맨 왼쪽 str 문자를 반환합니다. |
len(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
length(expr) | 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다. |
levenshtein(str1, str2) |
str1 및 str2 문자열 사이의 Levenshtein 거리를 반환합니다. |
str like (pattern[ESCAPE escape]) |
str 이 pattern 과 escape 가 일치하면 true를 반환합니다. |
locate(substr, str[, pos]) |
substr 위치 다음의 str 에서 pos 이 처음 나타나는 위치를 반환합니다. |
lower(expr) | 모든 문자가 소문자로 변경된 expr 을 반환합니다. |
lpad(expr, len[, pad]) | 길이가 expr 인 pad 로 왼쪽 패딩된 len 을 반환합니다. |
ltrim([trimstr,] str) |
str 이 제거된 선행 문자를 사용하여 trimStr 을 반환합니다. |
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) | 마스킹된 버전의 입력 str 을 반환합니다. |
md5(expr) |
expr 의 MD5 128비트 체크섬을 16진수 문자열로 반환합니다. |
octet_length(expr) | 문자열 데이터의 바이트 길이 또는 이진 데이터의 바이트 수를 반환합니다. |
overlay(input PLACING replace FROM pos [FOR len]) |
input 에서 시작되고 길이가 replace 인 pos 로 len 을 바꿉니다. |
overlay(input PLACING replace FROM pos [FOR len]) |
input 에서 시작되고 길이가 replace 인 pos 로 len 을 바꿉니다. |
parse_url(url, partToExtract[, key]) |
url 에서 일부를 추출합니다. |
position(substr, str[, pos]) |
substr 위치 다음의 str 에서 pos 이 처음 나타나는 위치를 반환합니다. |
position(subtr IN str) |
substr 위치 다음의 str 에서 pos 이 처음 나타나는 위치를 반환합니다. |
printf(strfmt[, obj1 [, …]]) | printf 스타일 형식 문자열의 형식 문자열을 반환합니다. |
randstr(length) |
length 알파 숫자 문자의 임의 문자열을 반환합니다. |
str regexp regex |
str 이 regex 와 일치하면 true를 반환합니다. |
str regexp_like regex |
str 이 regex 와 일치하면 true를 반환합니다. |
regexp_count(str, regexp) |
str 이 regexp 패턴과 일치하는 횟수를 반환합니다. |
regexp_extract(str, regexp[, idx]) |
str 에서 regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 첫 번째 문자열을 추출합니다. |
regexp_extract_all(str, regexp[, idx]) |
str 식과 일치하고 regexp 그룹 인덱스에 해당하는 regex 의 모든 문자열을 추출합니다. |
regexp_instr(str, regexp) |
str 와 일치하는 regexp 의 첫 번째 하위 문자열 위치를 반환합니다. |
regexp_replace(str, regexp, rep[, position]) |
str 와 일치하는 regexp 의 모든 부분 문자열을 rep 로 대체합니다. |
regexp_substr(str, regexp) |
str 와 일치하는 regexp 의 첫 번째 하위 문자열을 반환합니다. |
repeat(expr, n) |
expr
n 를 여러 번 반복하는 문자열을 반환합니다. |
바꾸기(str, search [, replace]) |
search 의 모든 항목을 replace 로 바꿉니다. |
reverse(expr) | 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다. |
right(str, len) | 문자열 len 에서 가장 오른쪽에 있는 str 문자를 반환합니다. |
str rlike regex |
str 이 regex 와 일치하면 true를 반환합니다. |
rpad(expr, len[, pad]) | 길이가 expr 인 pad 로 오른쪽 패딩된 len 을 반환합니다. |
rtrim([trimStr,] str) | 후행 문자가 제거된 str 을 반환합니다. |
sentences(str[, lang, country]) |
str 을 단어 배열의 배열로 분할합니다. |
sha(expr) | sha1 해시 값을 expr 의 16진수 문자열로 반환합니다. |
sha1(expr) | sha1 해시 값을 expr 의 16진수 문자열로 반환합니다. |
sha2(expr, bitLength) | SHA-2 제품군의 체크섬을 expr 의 16진수 문자열로 반환합니다. |
soundex(expr) | 문자열의 soundex 코드를 반환합니다. |
space(n) |
n 개의 공백으로 구성된 문자열을 반환합니다. |
split(str, regex[, limit]) |
str 와 일치하는 항목을 중심으로 regex 을 분할하고 길이가 최대 limit 인 배열을 반환합니다. |
split_part(str, delim, partNum) |
str 의 발생 항목을 기준으로 delim 을 분할하고 partNum 파트를 반환합니다. |
startswith(expr, startExpr) |
true
expr 또는 STRING 가 BINARY 로 시작하면 startExpr 를 반환합니다. |
string(expr) | 값 expr 를 STRING 로 캐스팅합니다. |
substr(expr, pos[, len]) |
expr 에서 시작되고 길이가 pos 인 len 의 하위 문자열을 반환합니다. |
substr(expr FROM pos[ FOR len]) |
expr 에서 시작되고 길이가 pos 인 len 의 하위 문자열을 반환합니다. |
substring(expr, pos[, len]) |
expr 에서 시작되고 길이가 pos 인 len 의 하위 문자열을 반환합니다. |
substring(expr FROM pos[ FOR len]) |
expr 에서 시작되고 길이가 pos 인 len 의 하위 문자열을 반환합니다. |
substring_index(expr, delim, count) | 구분 기호 expr 이 count 개 발생하기 전에 delim 의 부분 문자열을 반환합니다. |
to_binary(expr[, fmt]) |
expr 에 따라 이진 파일로 캐스팅된 fmt 를 반환합니다. |
to_char(numExpr, fmt) |
numExpr 형식을 사용하여 STRING 를 fmt 로 반환합니다.” |
to_varchar(numExpr, fmt) |
numExpr 형식을 사용하여 STRING 를 fmt 로 반환합니다.” |
translate(expr, from, to) |
expr
where은 from 의 모든 문자를 to 에 있는 문자로 대체하여 반환합니다. |
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) | 문자열에서 문자를 자릅니다. |
try_aes_decrypt(expr, key[, mode[, padding[, aad]]]) | AES 암호화를 사용하여 이진 expr 를 복호화하고 오류가 있는 경우 NULL 를 반환합니다. |
try_to_binary(expr [, fmt]) | 입력이 유효하지 않으면 expr 를 기준으로 BINARY 를 fmt 로, 입력이 유효하지 않으면 NULL 로 형변환하여 반환합니다. |
try_url_decode(str) |
application/x-www-form-urlencoded 형식에서 문자열을 다시 변환하고 오류가 있는 경우 NULL 를 반환합니다. |
try_zstd_decompress(value) | Zstandard 압축으로 압축 해제된 값을 반환하거나 입력이 유효하지 않은 경우 NULL 를 반환합니다. |
ucase(expr) | 모든 문자가 대문자로 변경된 expr 을 반환합니다. |
unbase64(expr) | 디코딩된 base64 문자열을 이진 형식으로 반환합니다. |
unhex(expr) | 16진수 expr 를 BINARY 로 변환합니다. |
upper(expr) | 모든 문자가 대문자로 변경된 expr 을 반환합니다. |
url_decode(str) | 문자열을 application/x-www-form-urlencoded 형식에서 다시 변환합니다. |
url_encode(str) | 문자열을 application/x-www-form-urlencoded 형식으로 변환합니다. |
zstd_compress (value[,level[,streaming_mode]]) | Zstandard 압축을 사용하여 압축된 값을 반환합니다. |
zstd_decompress(value) | Zstandard 압축으로 압축 해제된 값을 반환합니다. |
숫자 스칼라 함수
함수 | 설명 |
---|---|
~ expr |
NOT 의 비트 단위 expr 을 반환합니다. |
dividend / divisor |
dividend 로 나눈 divisor 값을 반환합니다. |
expr1 | expr2 |
OR 및 expr1 의 비트 expr2 을 반환합니다. |
- expr |
expr 의 부정 값을 반환합니다. |
expr1 - expr2 |
expr2 에서 expr1 를 뺀 값을 반환합니다. |
+ expr |
expr 의 값을 반환합니다. |
expr1 + expr2 |
expr1 및 expr2 의 합계를 반환합니다. |
dividend % divisor |
dividend
/
divisor 이후의 나머지를 반환합니다. |
expr1 ^ expr2 |
OR (XOR) 및 expr1 의 배타적 비트 expr2 을 반환합니다. |
expr1 & expr2 |
AND 및 expr1 의 비트 expr2 을 반환합니다. |
multiplier * multiplicand |
multiplier 에 multiplicand 를 곱한 값을 반환합니다. |
abs(expr) |
expr 에서 숫자 값의 절대값을 반환합니다. |
acos(expr) |
expr 의 역 코사인(아크코사인)을 반환합니다. |
acosh(expr) |
expr 의 역쌍곡 코사인 값을 반환합니다. |
asin(expr) |
expr 의 역사인(아크사인) 값을 반환합니다. |
asinh(expr) |
expr 의 하이퍼볼릭 역 사인 값을 반환합니다. |
atan(expr) |
expr 의 역탄젠트(아크탄젠트)를 반환합니다. |
atan2(exprY, exprX) | 평면의 양의 x축과 좌표(exprX , exprY )로 지정된 점 사이의 각도를 라디안 단위로 반환합니다. |
atanh(expr) |
expr 의 하이퍼볼릭 역 탄젠트 값을 반환합니다. |
bigint(expr) | 값 expr 를 BIGINT 로 캐스팅합니다. |
bit_count(expr) | 인수에서 set의 비트 수를 반환합니다. |
bit_get(expr, pos) | 정수 숫자의 이진 표현에서 비트 값을 반환합니다. |
bit_reverse(expr) | 인수의 비트 순서를 반대로 하여 얻은 값을 반환합니다. |
bitmap_bit_position(expr) | 버킷 내에서 주어진 BIGINT 숫자의 0 기준 비트 위치를 반환합니다. |
bitmap_bucket_number(expr) | 주어진 BIGINT 숫자에 대한 비트맵 버킷 번호를 반환합니다. |
bround(expr[,targetScale]) |
expr 반올림 모드를 사용하여 반올림된 HALF_EVEN 을 반환합니다. |
cbrt(expr) |
expr 의 세제곱근을 반환합니다. |
ceil(expr[,targetScale]) | 소수점을 기준으로 expr 자리까지 반올림된 targetScale 보다 작지 않으면서, 가장 작은 수를 반환합니다. |
ceiling(expr[,targetScale]) | 소수점을 기준으로 expr 자리까지 반올림된 targetScale 보다 작지 않으면서, 가장 작은 수를 반환합니다. |
conv(num, fromBase, toBase) |
num 을 fromBase 에서 toBase 로 변환합니다. |
convert_timezone([sourceTz, ]targetTz, sourceTs) |
TIMESTAMP_NTZ 시간대의 sourceTs sourceTz 를 targetTz 로 변환합니다. |
cos(expr) |
expr 의 코사인을 반환합니다. |
cosh(expr) |
expr 의 하이퍼볼릭 코사인을 반환합니다. |
cot(expr) |
expr 의 코탄젠트를 반환합니다. |
csc(expr) |
expr 의 코시컨트를 반환합니다. |
decimal(expr) | 값 expr 를 DECIMAL 로 캐스팅합니다. |
degrees(expr) | 라디안을 도로 변환합니다. |
divisor div dividend |
divisor 를 dividend 로 나눈 값의 정수 부분을 반환합니다. |
double(expr) | 값 expr 를 DOUBLE 로 캐스팅합니다. |
e() |
e 상수를 반환합니다. |
exp(expr) |
e 의 expr 제곱을 반환합니다. |
expm1(expr) |
exp(expr) - 1 을(를) 반환합니다. |
factorial(expr) |
expr 의 계승을 반환합니다. |
float(expr) | 값 expr 를 FLOAT 로 캐스팅합니다. |
floor(expr[,targetScale]) | 소수점을 기준으로 expr 자리까지 반올림하여 targetScale 보자 작지 않은 가장 큰 수를 반환합니다. |
getbit(expr, pos) | 정수 숫자의 이진 표현에서 비트 값을 반환합니다. |
hypot(expr1, expr2) |
sqrt(expr1 * expr1 + expr2 * expr2) 을(를) 반환합니다. |
int(expr) | 값 expr 를 INTEGER 로 캐스팅합니다. |
isnan(expr) |
true 가 expr 이면 NaN 를 반환합니다. |
ln(expr) |
e 의 자연 로그(밑 expr )를 반환합니다. |
log([base,] expr) |
expr 를 사용하여 base 의 로그를 반환합니다. |
log1p(expr) |
log(1 + expr) 을(를) 반환합니다. |
log2(expr) | 밑이 expr 인 2 의 로그를 반환합니다. |
log10(expr) | 밑이 expr 인 10 의 로그를 반환합니다. |
mod(dividend, divisor) |
dividend / divisor 이후의 나머지를 반환합니다. |
nanvl(expr1, expr2) |
expr1 이 아니면 NaN 을 반환하고, 그렇지 않으면 expr2 를 반환합니다. |
negative(expr) |
expr 의 부정 값을 반환합니다. |
'nullifzero(expr)' |
expr 0 NULL 이 아니면 반환합니다. |
pi() | pi를 반환합니다. |
pmod(dividend, divisor) |
dividend / divisor 이후의 양수 나머지를 반환합니다. |
positive(expr) |
expr 의 값을 반환합니다. |
pow(expr1, expr2) | 지수가 expr1 인 expr2 의 거듭제곱을 계산합니다. |
power(expr1, expr2) | 지수가 expr1 인 expr2 의 거듭제곱을 계산합니다. |
radians(expr) | 도 단위 expr 을 라디안으로 변환합니다. |
rand([seed]) | 0에서 1 사이의 임의 값을 반환합니다. |
randn([seed]) | 표준 정규 분포에서 임의 값을 반환합니다. |
random([seed]) | 0에서 1 사이의 임의 값을 반환합니다. |
rint(expr) |
expr 를 정수로 반올림하여 DOUBLE 로 반환합니다. |
round(expr[,targetScale]) |
expr 반올림 모드를 사용하여 반올림된 HALF_UP 을 반환합니다. |
sec(expr) |
expr 의 시컨트를 반환합니다. |
shiftleft(expr, n) |
n 비트 단위로 왼쪽으로 이동한 비트를 반환합니다. |
shiftright(expr, n) |
n 비트만큼 오른쪽으로 이동한 비트 부호 있는 부호 있는 정수를 반환합니다. |
shiftrightunsigned(expr, n) |
n 비트로 오른쪽으로 이동된 비트 부호 없는 부호 있는 정수를 반환합니다. |
sign(expr) |
expr 이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다. |
signum(expr) |
expr 이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다. |
sin(expr) |
expr 의 사인을 반환합니다. |
sinh(expr) |
expr 의 하이퍼볼릭 사인을 반환합니다. |
smallint(expr) | 값 expr 를 SMALLINT 로 캐스팅합니다. |
sqrt(expr) |
expr 의 제곱근을 반환합니다. |
tan(expr) |
expr 의 탄젠트를 반환합니다. |
tanh(expr) |
expr 의 하이퍼볼릭 탄젠트를 반환합니다. |
tinyint(expr) |
expr 에서 TINYINT 로 캐스트. |
to_number(expr, fmt ) |
expr 형식을 사용하여 DECIMAL 를 fmt 로 반환합니다. |
try_add(expr1, expr2) |
expr1 와 expr2 의 합계 또는 오류가 있는 경우 NULL 를 반환합니다. |
try_divide(dividend, divisor) |
dividend 를 divisor 로 나눈 값 또는 NULL 가 0이면 divisor 를 반환합니다. |
try_mod(dividend, divisor) |
dividend / divisor 를 제외한 나머지를 반환하거나 NULL 가 0이면 divisor 를 반환합니다. |
try_multiply(multiplier, multiplicand) |
multiplier 과 multiplicand 의 곱 또는 오버플로의 NULL 을 반환합니다. |
try_subtract(expr1, expr2) |
expr2 에서 expr1 를 뺀 값이나, 오버플로에 대해 NULL 을 반환합니다. |
try_to_number(expr, fmt ) | 형식 expr 를 사용하여 DECIMAL 를 fmt 로 변환하거나, NULL 가 형식과 일치하지 않으면 expr 로 변환합니다. |
uniform(expr1, expr2 [,seed]) | 지정된 숫자 범위 내에서 독립적이고 동일하게 분산된 values 있는 임의 값을 반환합니다. |
width_bucket(expr, minExpr, maxExpr, numBuckets) | 등 너비 히스토그램의 값에 대한 버킷 번호를 반환합니다. |
'zeroifnull(expr)' | 그렇지 않은 경우 반환하거나 expr 그렇지 않은 NULL 경우 반환 0 합니다. |
집계 함수
함수 | 설명 |
---|---|
any(expr) | 그룹에서 expr 의 값 중 하나 이상이 true이면 true를 반환합니다. |
any_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 일부 값을 반환합니다. |
approx_count_distinct(expr[,relativeSD]) | 그룹 내의 values에서 서로 다른 expr 의 예상 수를 반환합니다. |
approx_percentile(expr,percentage[,accuracy]) | 그룹 내 expr 의 백분위수 근사치를 반환합니다. |
approx_top_k(expr[,k[,maxItemsTracked]]) | 대략적인 개수와 함께 k values 가장 자주 발생하는 상위 expr 항목을 반환합니다. |
array_agg(expr) | 그룹 내의 values에 있는 모든 expr 으로 이루어진 배열을 반환합니다. |
avg(expr) | 그룹의 values에서 계산된 평균을 반환합니다. |
bit_and(expr) | 그룹 내 모든 입력 AND 에 대해 비트 연산 values 결과를 반환합니다. |
bit_or(expr) | 그룹 내 모든 입력 OR 에 대해 비트 연산 values 결과를 반환합니다. |
bit_xor(expr) | 그룹 내 모든 입력 XOR 에 대해 비트 연산 values 결과를 반환합니다. |
bitmap_construct_agg(expr) | 비트 위치 OR 의 모든 비트에 대해 비트 연산 values을 반환합니다. 그룹에서 0에서 32767 사이의 값을 BINARY 로 지정합니다. |
bitmap_or_agg(expr) | 모든 OR 입력 BINARY 에 대한 비트 연산 values을(를) 그룹에서 반환합니다. |
bool_and(expr) |
values 내의 모든 expr 가 참이면 true를 반환합니다. |
bool_or(expr) | 그룹 내에서 expr 에 하나 이상의 값이 true이면 true를 반환합니다. |
collect_list(expr) | 그룹 내의 values에 있는 모든 expr 으로 이루어진 배열을 반환합니다. |
collect_set(expr) | 모든 고유 values으로 구성된 배열을 그룹 내의 expr 에서 반환합니다. |
corr(expr1,expr2) | 숫자 쌍 그룹 간의 피어슨 상관 관계 계수를 반환합니다. |
count(*) | null이 있는 행을 포함하여 그룹에서 검색된 총 행 수를 반환합니다. |
count(expr[, …]) | 제공된 식이 모두 null이 아닌 그룹의 행 수를 반환합니다. |
count_if(expr) |
values그룹의 true expr 개수를 반환합니다. |
count_min_sketch(column,epsilon,confidence,seed) |
values, column 및 epsilon 를 사용하여 confidence 그룹에 있는 모든 seed 의 카운트-민 스케치를 반환합니다. |
covar_pop(expr1,expr2) | 그룹에 있는 숫자 쌍의 모집단 공 분산을 반환합니다. |
covar_samp(expr1,expr2) | 그룹에 있는 숫자 쌍의 표본 공 분산을 반환합니다. |
every(expr) | 조건: 그룹의 모든 valuesexpr 가 true인 경우, 결과로 true를 반환합니다. |
first(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 첫 번째 값을 반환합니다. |
first_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 첫 번째 값을 반환합니다. |
histogram_numeric(expr,numBins) |
expr 구간차원을 가진 numBins 에 대한 히스토그램을 계산하여 구간차원 중심을 나타내는 쌍의 배열을 반환합니다. |
hll_sketch_agg(expr[,lgConfigK]) | 고유한 values 개수를 근사하는 데 사용되는 HyperLogLog 스케치를 반환합니다. |
hll_union_agg(expr[,allowDifferentLgConfigK]) | 행 그룹에 대한 HyperLogLog 스케치를 집계합니다. |
kurtosis(expr) | 그룹의 values에서 계산된 첨도 값을 반환합니다. |
last(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 마지막 값을 반환합니다. |
last_value(expr[,ignoreNull]) | 행 그룹에 대한 expr 의 마지막 값을 반환합니다. |
max(expr) | 그룹의 expr 최댓값을 반환합니다. |
max_by(expr1,expr2) | 그룹의 expr1 최댓값과 연결된 expr2 의 값을 반환합니다. |
mean(expr) | 그룹의 values에서 계산된 평균을 반환합니다. |
median(expr) | 그룹의 values에서 계산된 중앙값을 반환합니다. |
min(expr) | 그룹에서 expr 의 최솟값을 반환합니다. |
min_by(expr1, expr2) | 그룹의 최솟값 expr1 와 연결된 expr2 값을 반환합니다. |
mode(expr [,deterministic]) | 그룹에서 가장 빈번한 NULL 값이 아닌 expr 값을 반환합니다. |
percentile(expr, percentage [,frequency]) | 지정된 expr 에서 percentage 의 정확한 백분위수 값을 반환합니다. |
percentile_approx(expr,percentage[,accuracy]) | 그룹 내 expr 의 백분위수 근사치를 반환합니다. |
percentile_cont(pct) WITHIN GROUP(ORDER BY 키) | 그룹 내에서 보간된 key 의 백분위수를 반환합니다. |
percentile_disc(pct) WITHIN GROUP(ORDER BY 키) | 그룹 내의 key 에 대한 불연속 백분위수를 반환합니다. |
regr_avgx(yExpr, xExpr) | 그룹 xExpr 에서 values으로 계산된 where의 평균을 반환하며,xExpr 와 yExpr 은(는) NOT NULL 입니다. |
regr_avgy(yExpr, xExpr) | 그룹 yExpr 에서 values으로 계산된 where의 평균을 반환하며,xExpr 와 yExpr 은(는) NOT NULL 입니다. |
regr_count(yExpr, xExpr) | 그룹에 있는 Null이 아닌 값 쌍 yExpr , xExpr 의 개수를 반환합니다. |
regr_intercept(yExpr, xExpr) | 그룹 내 유니변량 선형 회귀선의 절편을 반환하며, where,xExpr , 그리고 yExpr 가 NULL이 아님을 조건으로 합니다. |
regr_r2(yExpr, xExpr) | 그룹 values,where 및 xExpr 의 결정 계수를 반환하며, 이때 yExpr 는 NULL이 아닙니다. |
regr_slope(yExpr, xExpr) | 그룹에서 null이 아닌 값 쌍 yExpr , xExpr 의 선형 회귀선의 기울기를 반환합니다. |
regr_sxx(yExpr, xExpr) | 그룹 xExpr values의 wherexExpr 제곱 합계를 반환하며, yExpr 가 NULL이 아니어야 합니다. |
regr_sxy(yExpr, xExpr) | 그룹 yExpr xExpr 의 values에서 where과 xExpr 의 곱을 계산하여 yExpr NOT NULL 의 합계를 반환합니다. |
regr_syy(yExpr, xExpr) | 그룹 yExpr values의 wherexExpr 제곱 합계를 반환하며, yExpr 가 NULL이 아니어야 합니다. |
schema_of_json_agg(json[, options]) | 그룹 내 schema 문자열을 결합한 결과를 DDL 형식으로 JSON 로 반환합니다. |
schema_of_variant_agg(variantExpr) | DDL 형식으로 그룹 내의 모든 schemaVARIANT 의 결합된 values를 반환합니다. |
skewness(expr) | 그룹의 values에서 계산된 왜도 값을 반환합니다. |
some(expr) | 그룹에서 하나 이상의 expr 값이 true 이면 true를 반환합니다. |
std(expr) | 그룹 내 values에서 계산된 샘플 표준 편차를 반환합니다. |
stddev(expr) | 그룹 내 values에서 계산된 샘플 표준 편차를 반환합니다. |
stddev_pop(expr) | values에서 계산한 그룹의 모집단 표준 편차를 반환합니다. |
stddev_samp(expr) | values에서 계산된 그룹의 샘플 표준 편차를 반환합니다. |
sum(expr) | 그룹의 values에서 계산된 합계를 반환합니다. |
try_avg(expr) | 그룹의 values에서 계산된 평균을 반환하며, 오버플로가 있는 경우 NULL 을 반환합니다. |
try_sum(expr) | 오버플로가 없는 경우 그룹의 values에서 계산된 합계를 반환하며, 오버플로가 있는 경우 NULL 에서 반환합니다. |
var_pop(expr) | 그룹의 values에서 계산한 모집단 분산을 반환합니다. |
var_samp(expr) | 그룹의 values에서 계산된 샘플 분산을 반환합니다. |
variance(expr) | 그룹의 values에서 계산된 샘플 분산을 반환합니다. |
window 함수 순위 지정
함수 | 설명 |
---|---|
dense_rank() | values에서 모든 partition과 비교하여 값의 순위를 반환합니다. |
ntile(n) | 각 windowpartition 행을 1에서 최대 n 범위의 n 버킷으로 나눕니다. |
percent_rank() | partition내 값의 백분율 순위를 계산합니다. |
rank() | values에서 모든 partition과 비교하여 값의 순위를 반환합니다. |
row_number() | window partition내의 행 순서에 따라 각 행에 처음부터 1로 시작하여 고유한 순차 번호를 할당합니다. |
분석 window 함수
함수 | 설명 |
---|---|
cume_dist() | 값이 values에서 모든 partition에 상대적으로 위치하는 위치를 반환합니다. |
lag(expr[,offset[,default]]) |
expr 내의 이전 행에서 partition 값을 반환합니다. |
lead(expr[,offset[,default]]) |
expr 내의 후속 행에서 partition 값을 반환합니다. |
nth_value(expr, offset[, ignoreNulls]) |
expr 의 offset 에서 특정 window 값을 반환합니다. |
배열 함수
함수 | 설명 |
---|---|
arrayExpr[indexExpr] |
indexExpr ARRAY의 arrayExpr 위치에 있는 요소를 반환합니다. |
aggregate(expr,start,merge[,finish]) | 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다. |
array([expr [, …]]) |
expr 의 요소가 있는 배열을 반환합니다. |
array_append(array, elem) |
array 에 의해 추가된 elem 값을 반환합니다. |
array_compact(array) |
values에서 NULL array 을 제거합니다. |
array_contains(array,value) |
array 에 value 가 포함되어 있으면 true를 반환합니다. |
array_distinct(array) |
values에서 중복된 array 을 제거합니다. |
array_except(array1,array2) |
array1 에는 있지만 array2 에는 없는 요소의 배열을 반환합니다. |
array_insert(array, index, elem) | 확장된 array whereelem 이 index 위치에 삽입된 상태로 반환됩니다. |
array_intersect(array1,array2) |
array1 과 array2 의 교집합에 있는 요소의 배열을 반환합니다. |
array_join(array,delimiter[,nullReplacement]) |
array 의 요소를 연결합니다. |
array_max(array) |
array 의 최댓값을 반환합니다. |
array_min(array) |
array 의 최솟값을 반환합니다. |
array_position(array,element) |
element 에서 처음으로 나오는 array 의 위치를 반환합니다. |
array_prepend(array, elem) |
array 가 앞에 붙은 elem 를 반환합니다. |
array_remove(array,element) |
element 에서 array 의 모든 항목을 제거합니다. |
array_repeat(element,count) |
element
count 회가 포함된 배열을 반환합니다. |
array_size(array) |
array 의 요소 수를 반환합니다. |
array_sort(array,func) |
array 에 따라 정렬된 func 를 반환합니다. |
array_union(array1,array2) |
array1 과 array2 의 합집합에 있는 요소의 배열을 중복 없이 반환합니다. |
arrays_overlap(array1, array2) |
array1 과 array2 의 교집합이 비어 있지 않으면 true를 반환합니다. |
arrays_zip(array1 [, …]) | 입력 배열의 모든 n번째 values을 포함하는 nth 구조체가 포함된 구조체의 병합된 배열을 반환합니다. |
cardinality(expr) |
expr 의 크기를 반환합니다. |
concat(expr1, expr2 [, …]) | 인수의 연결을 반환합니다. |
element_at(arrayExpr, index) |
arrayExpr 에 있는 index 의 요소를 반환합니다. |
exists(expr, pred) |
pred 가 expr 의 모든 요소에 대해 true이면 true를 반환합니다. |
explode(collection) |
collection 중첩을 해제하여 행을 반환합니다. |
explode_outer(collection) | 외부 의미 체계를 사용하는 collection 의 중첩을 해제하여 행을 반환합니다. |
filter(expr,func) |
expr 함수를 사용하여 func 의 배열을 필터링합니다. |
flatten(arrayOfArrays) | 배열의 배열을 단일 배열로 변환합니다. |
forall(expr, predFunc) |
predFunc 이 배열의 모든 요소에 대해 유지되는지 여부를 테스트합니다. |
get(arrayExpr, index) |
arrayExpr 에서 index 부터 0 의 요소를 반환합니다. |
인라인(입력) | 구조체 배열을 table으로 세분화합니다. |
inline_outer(입력) | 구조체 배열을 외부 의미 체계로 table로 확장합니다. |
posexplode(collection) | 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다. |
posexplode_outer(컬렉션) |
OUTER 의미 체계를 사용하여 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다. |
reduce(expr,start,merge[,finish]) | 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다. |
reverse(array) | 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다. |
sequence(start,stop,step) |
start 에서 stop (포함)까지의 요소의 배열을 생성하고 step 단위로 증분합니다. |
shuffle(array) |
expr 에서 배열의 임의 순열을 반환합니다. |
size(expr) |
expr 의 카디널리티를 반환합니다. |
slice(expr,start,length) | 배열의 하위 집합을 반환합니다. |
sort_array(expr[,ascendingOrder]) |
expr 의 배열을 정렬 순서로 반환합니다. |
transform(expr, func) |
expr 함수를 사용하여 func 에 있는 배열의 요소를 변환합니다. |
try_element_at(arrayExpr, index) |
arrayExpr 의 index 요소 또는 NULL (index 가 경계를 벗어난 경우)을 반환합니다. |
zip_with(expr1, expr2, func) |
expr1 을 사용하여 expr2 및 func 의 배열을 요소 단위로 단일 배열로 병합합니다. |
Map 함수
함수 | 설명 |
---|---|
mapExpr[keyExpr] |
keyExpr MAP의 mapExpr 에 있는 값을 반환합니다. |
cardinality(expr) |
expr 의 크기를 반환합니다. |
element_at(mapExpr, key) |
mapExpr 의 key 값을 반환합니다. |
explode(collection) |
expr 중첩을 해제하여 행을 반환합니다. |
explode_outer(collection) | 외부 의미 체계를 사용하는 expr 의 중첩을 해제하여 행을 반환합니다. |
map([{key1, value1}[, …]]) | 지정된 키-값 쌍을 사용하여 맵을 만듭니다. |
map_concat([expr1 [, …]]) | 모든 expr 맵 식의 합집합을 반환합니다. |
map_contains_key(map, key) |
true 에 map 가 포함된 경우 key 를 반환하고 아닌 경우 false 를 반환합니다. |
map_entries(map) |
map 에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다. |
map_filter(expr, func) |
expr 함수를 사용하여 func 에서 맵의 항목을 필터링합니다. |
map_from_arrays(키, values) | 한 쌍의 keys 및 values 배열을 사용하여 맵을 만듭니다. |
map_from_entries(expr) | 지정된 항목 배열에서 만들어진 맵을 만듭니다. |
map_keys(map) |
map 의 키를 포함하는 정렬되지 않은 배열을 반환합니다. |
map_values(map) |
values의 map 를 포함하는 순서가 없는 배열을 반환합니다. |
map_zip_with(map1, map2, func) |
map1 및 map2 를 단일 맵으로 병합합니다. |
size(expr) |
expr 의 카디널리티를 반환합니다. |
str_to_map(expr[,pairDelim[,keyValueDelim]]) | 구분 기호를 사용하여 expr 을 키-값 쌍으로 분할한 후 맵을 반환합니다. |
transform_keys(expr, func) |
expr 함수를 사용하여 func 의 맵에 있는 키를 변환합니다. |
transform_values(expr, func) | 함수 values를 사용하여 expr 을/를 func 맵으로 변환합니다. |
try_element_at(mapExpr, key) |
mapExpr 의 key 값 또는 NULL (key 가 존재하지 않는 경우)을 반환합니다. |
날짜, 타임스탬프 및 간격 함수
날짜 및 타임스탬프 형식에 대한 자세한 내용은 날짜/시간 패턴을 참조하세요.
함수 | 설명 |
---|---|
intervalExpr / divisor | 간격을 divisor 로 나눈 값을 반환합니다. |
- intervalExpr |
intervalExpr 의 부정 값을 반환합니다. |
intervalExpr1 - intervalExpr2 |
intervalExpr2 에서 intervalExpr1 를 뺀 값을 반환합니다. |
datetimeExpr1 - datetimeExpr2 |
datetimeExpr2 에서 datetimeExpr1 를 뺀 값을 반환합니다. |
+ intervalExpr |
intervalExpr 의 값을 반환합니다. |
intervalExpr1 + intervalExpr2 |
intervalExpr1 및 intervalExpr2 의 합계를 반환합니다. |
intervalExpr * multiplicand |
intervalExpr 에 multiplicand 를 곱한 값을 반환합니다. |
abs(expr) |
expr 의 간격 값에 대한 절댓값을 반환합니다. |
add_months(startDate,numMonths) |
numMonths 이후의 startDate 날짜를 반환합니다. |
curdate() | 쿼리 평가 시작 시 현재 날짜를 반환합니다. |
current_date() | 쿼리 평가 시작 시 현재 날짜를 반환합니다. |
current_timestamp() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
current_timezone() | 현재 세션의 로컬 timezone를 반환합니다. |
date(expr) |
expr 값을 DATE로 캐스팅합니다. |
date_add(startDate,numDays) |
numDays 이후의 날짜 startDate 를 반환합니다. |
date_add(unit, value, expr) | 타임스탬프 value 에 unit expr 를 추가합니다. |
date_diff(unit, start, stop) |
unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
date_format(expr,fmt) | 타임스탬프를 fmt 형식의 문자열로 변환합니다. |
date_from_unix_date(days) |
1970-01-01 이후의 일 수에서 날짜를 만듭니다. |
date_part(field,expr) | 날짜, 타임스탬프 또는 간격의 일부를 추출합니다. |
date_sub(startDate,numDays) |
numDays 이전의 날짜 startDate 를 반환합니다. |
date_trunc(unit,expr) |
unit 에 지정된 단위로 잘린 타임스탬프를 반환합니다. |
dateadd(startDate,numDays) |
numDays 이후의 날짜 startDate 를 반환합니다. |
dateadd(unit, value, expr) | 타임스탬프 value 에 unit expr 를 추가합니다. |
datediff(endDate,startDate) |
startDate 에서 endDate 까지의 일 수를 반환합니다. |
datediff(unit, start, stop) |
unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
day(expr) | 날짜 또는 타임스탬프의 날짜를 반환합니다. |
dayname(expr) | 지정된 날짜의 요일에 대한 세 글자 영어 약어를 반환합니다. |
dayofmonth(expr) | 날짜 또는 타임스탬프의 날짜를 반환합니다. |
dayofweek(expr) | 날짜 또는 타임스탬프의 요일을 반환합니다. |
dayofyear(expr) | 날짜 또는 타임스탬프의 연간 일자를 반환합니다. |
divisor div dividend |
divisor 간격을 dividend 간격으로 나눈 값의 정수 부분을 반환합니다. |
extract(field FROM source) |
field 의 source 를 반환합니다. |
from_unixtime(unixTime,fmt) |
unixTime 의 fmt 을 반환합니다. |
from_utc_timestamp(expr,timezone) | 타임스탬프의 UTC 타임스탬프를 expr timeZone 반환합니다. |
getdate() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
hour(expr) | 타임스탬프의 시간 구성 요소를 반환합니다. |
last_day(expr) | 날짜가 속한 월의 마지막 날짜를 반환합니다. |
make_date(year,month,day) |
year , month , day 필드에서 날짜를 만듭니다. |
make_dt_interval([days[, hours[, mins[, secs]]]]) |
days , hours , mins 및 secs 에서 일-시간 간격을 만듭니다. |
make_interval(years, months, weeks, days, hours, mins, secs) | 사용되지 않음: years , months , weeks , days , hours , mins 및 secs 에서 간격을 만듭니다. |
make_timestamp(year,month,day,hour,min,sec[,timezone]) |
year , month , day , hour , min , sec 및 timezone 필드에서 타임스탬프를 만듭니다. |
make_ym_interval([years[, months]]) |
years 및 months 에서 연-월 간격을 만듭니다. |
minute(expr) |
expr 에 있는 타임스탬프의 분 구성 요소를 반환합니다. |
month(expr) |
expr 에 있는 타임스탬프의 월 구성 요소를 반환합니다. |
months_between(expr1,expr2[,roundOff]) |
expr1 및 expr2 에 있는 날짜 또는 타임스탬프 사이에서 경과된 월 수를 반환합니다. |
next_day(expr,dayOfWeek) |
expr 보다 나중이고 이름이 dayOfWeek 인 첫 번째 날짜를 반환합니다. |
now() | 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다. |
quarter(expr) | 1에서 4 범위에서 expr 의 연도 분기를 반환합니다. |
second(expr) |
expr 에 있는 타임스탬프의 초 구성 요소를 반환합니다. |
session_window(expr, gpDuration) | 타임스탬프 표현식을 통해 세션window을 만듭니다. |
sign(expr) |
expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다. |
signum(expr) |
expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다. |
timediff(unit, start, stop) |
unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
timestamp(expr) |
expr 에서 TIMESTAMP 로 캐스트. |
timestamp_micros(expr) | UTC Epoch 이후 타임스탬프 expr 마이크로초를 만듭니다. |
timestamp_millis(expr) | UTC epoch 이후 타임스탬프 expr 밀리초를 만듭니다. |
timestamp_seconds(expr) | UTC epoch 이후 타임스탬프 expr 초를 만듭니다. |
timestampadd(unit, value, expr) | 타임스탬프 value 에 unit expr 를 추가합니다. |
timestampdiff(unit, start, stop) |
unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다. |
to_date(expr[,fmt]) | 선택적 서식을 사용한 날짜로 캐스팅된 expr 을 반환합니다. |
to_timestamp(expr[,fmt]) | 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr 을 반환합니다. |
to_unix_timestamp(expr[,fmt]) |
expr 의 타임스탬프를 UNIX 타임스탬프로 반환합니다. |
to_utc_timestamp(expr,timezone) | 타임스탬프의 UTC 타임스탬프를 expr timezone 반환합니다. |
trunc(expr, fmt) | 날짜의 일부가 형식 모델 fmt 에 의해 지정된 단위로 잘린 날짜를 반환합니다. |
try_add(expr1, expr2) |
expr1 및 expr2 의 합계를 반환하며 오류 발생 시 NULL을 반환합니다. |
try_divide(dividend, divisor) |
dividend 를 divisor 로 나눈 값을 반환하거나 divisor 가 0이면 NULL을 반환합니다. |
try_multiply(multiplier, multiplicand) |
multiplier 과 multiplicand 의 곱 또는 오버플로의 NULL 을 반환합니다. |
try_subtract(expr1, expr2) |
expr2 에서 expr1 를 뺀 값이나, 오버플로에 대해 NULL 을 반환합니다. |
try_to_timestamp(expr[,fmt]) | 선택적 형식을 사용하여 타임스탬프로 캐스팅된 expr 을 반환하거나 캐스팅이 실패하면 NULL 을 반환합니다. |
unix_date(expr) |
1970-01-01 이후의 일 수를 반환합니다. |
unix_micros(expr) |
1970-01-01 00:00:00 UTC 이후 경과된 마이크로초 수를 반환합니다. |
unix_millis(expr) |
1970-01-01 00:00:00 UTC 이후 경과된 밀리초 수를 반환합니다. |
unix_seconds(expr) |
1970-01-01 00:00:00 UTC 이후 경과된 초 수를 반환합니다. |
unix_timestamp([expr[, fmt]]) | 현재 또는 지정된 시간의 UNIX 타임스탬프를 반환합니다. |
weekday(expr) |
expr 의 요일을 반환합니다. |
weekofyear(expr) |
expr 연도의 주를 반환합니다. |
year(expr) |
expr 의 연도 구성 요소를 반환합니다. |
window(expr, width[, step[, start]]) | 타임스탬프 식에 대한 호핑 기반 슬라이딩window 만듭니다. |
window_time(window) | window 또는 window 함수로 생성된 슬라이딩의 포함된 종료 시간을 반환합니다. |
H3 지리 공간적 함수
H3 지리 공간적 함수에 대한 자세한 내용은 H3 지리 공간적 함수를 참조하세요.
캐스트 함수 및 생성자
형식 간 캐스팅에 대한 자세한 내용은 캐스트 함수와 try_cast 함수를 참조하세요.
함수 | 설명 |
---|---|
array([expr [, …]]) |
expr 의 요소가 있는 배열을 반환합니다. |
bigint(expr) | 값 expr 를 BIGINT 로 캐스팅합니다. |
binary(expr) |
expr 의 값을 BINARY 로 캐스팅합니다. |
boolean(expr) |
expr 에서 BOOLEAN 로 캐스트. |
cast(expr AS type) | 값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
expr :: type | 값 expr 을 대상 데이터 형식 type 으로 캐스트합니다. |
date(expr) | 값 expr 를 DATE 로 캐스팅합니다. |
decimal(expr) | 값 expr 를 DECIMAL 로 캐스팅합니다. |
double(expr) | 값 expr 를 DOUBLE 로 캐스팅합니다. |
float(expr) | 값 expr 를 FLOAT 로 캐스팅합니다. |
int(expr) | 값 expr 를 INTEGER 로 캐스팅합니다. |
make_date(year,month,day) |
year , month , day 필드에서 날짜를 만듭니다. |
make_dt_interval([days[, hours[, mins[, secs]]]]) |
days , hours , mins 및 secs 에서 일-시간 간격을 만듭니다. |
make_interval(years, months, weeks, days, hours, mins, secs) |
years , months , weeks , days , hours , mins 및 secs 에서 간격을 만듭니다. |
make_timestamp(year,month,day,hour,min,sec[,timezone]) |
year , month , day , hour , min , sec 및 timezone 필드에서 타임스탬프를 만듭니다. |
make_ym_interval([years[, months]]) |
years 및 months 에서 연-월 간격을 만듭니다. |
map([{key1, value1} [, …]]) | 지정된 키-값 쌍을 사용하여 맵을 만듭니다. |
named_struct({name1, val1} [, …]) | 지정된 필드 이름과 values사용하여 구조체를 만듭니다. |
smallint(expr) | 값 expr 를 SMALLINT 로 캐스팅합니다. |
string(expr) | 값 expr 를 STRING 로 캐스팅합니다. |
struct(expr1 [, …]) | 지정된 필드 STRUCT 을 사용하여 values을 만듭니다. |
tinyint(expr) |
expr 에서 TINYINT 로 캐스트. |
timestamp(expr) |
expr 에서 TIMESTAMP 로 캐스트. |
to_char(expr, fmt) |
expr 형식을 사용하여 STRING 를 fmt 로 반환합니다.” |
to_date(expr[,fmt]) | 선택적 서식을 사용한 날짜로 캐스팅된 expr 을 반환합니다. |
to_number(expr, fmt) |
expr 형식을 사용하여 DECIMA 를 fmt L로 반환합니다. |
to_timestamp(expr[,fmt]) | 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr 을 반환합니다. |
to_varchar(expr, fmt) |
expr 형식을 사용하여 STRING 를 fmt 로 반환합니다.” |
try_cast(expr AS type) |
expr 값을 type 대상 데이터 형식으로 안전하게 캐스팅합니다. |
try_to_number(expr, fmt) | 형식 expr 를 사용하여 DECIMAL 를 fmt 로 형변환하거나, NULL 가 유효하지 않은 경우 expr 로 반환합니다. |
CSV 및 Avro 함수
함수 | 설명 |
---|---|
from_avro(avroBin, jsonSchema[, options]) | 및 에 따라 avroBin 구조체 값을 반환합니다 jsonSchema . |
from_csv(csvStr, schema[, 옵션]) |
csvStr 및 schema 가 있는 구조체 값을 반환합니다. |
schema_of_csv(csv[, options]) | CSV 문자열의 schema을 DDL 형식으로 반환합니다. |
to_avro(expr[, options]) | 지정된 구조체 값을 사용하여 Avro 이진 값을 반환합니다. |
to_csv(expr[, options]) | 지정된 구조체 값이 있는 CSV 문자열을 반환합니다. |
JSON 함수
함수 | 설명 |
---|---|
jsonStr : jsonPath |
jsonStr 에서 추출된 필드를 반환합니다. |
from_json(jsonStr, schema[, 옵션]) |
jsonStr 및 schema 가 있는 구조체 값을 반환합니다. |
get_json_object(expr, path) |
JSON 에서 path 개체를 추출합니다. |
json_array_length(jsonArray) | 가장 바깥쪽 JSON 배열의 요소 수를 반환합니다. |
json_object_keys(jsonObject) | 가장 바깥쪽 JSON 개체의 모든 키를 배열로 반환합니다. |
json_tuple(jsonStr, path1 [, …]) | 여러 JSON 개체를 튜플로 반환합니다. |
parse_json(jsonStr) |
VARIANT 에서 jsonStr 값을 반환합니다. |
schema_of_json(jsonStr[, options]) |
schema 문자열의 JSON 을 DDL 형식으로 반환합니다. |
schema_of_json_agg(jsonStr[, options]) | 그룹 내 schema 문자열을 결합한 결과를 DDL 형식으로 JSON 로 반환합니다. |
to_json(expr[, options]) |
STRUCT 에 지정된 VARIANT 또는 expr 가 포함된 JSON 문자열을 반환합니다. |
VARIANT 함수
함수 | 설명 |
---|---|
variantExpr : jsonPath | JSON 경로를 사용하여 variantExpr 에서 추출한 필드를 반환합니다. |
is_variant_null(variantExpr) | 테스트 variantExpr 가 VARIANT 로 인코딩된 NULL 인지 여부를 확인합니다. |
parse_json(jsonStr) |
VARIANT 에서 jsonStr 값을 반환합니다. |
schema_of_variant(variantExpr) |
schema 식의 VARIANT 을 DDL 형식으로 반환합니다. |
schema_of_variant_agg(variantExpr) | DDL 형식으로 그룹 내의 모든 schemaVARIANT 의 결합된 values를 반환합니다. |
to_json(expr[, options]) |
STRUCT 에 지정된 VARIANT 또는 expr 가 포함된 JSON 문자열을 반환합니다. |
try_parse_json(jsonStr) |
VARIANT 가 가능한 경우 jsonStr 값을 반환합니다.
NULL 가 가능 하지 않은 경우 반환됩니다. |
try_variant_get(variantExpr,path,type) | 대상 형식으로 형변환할 수 없는 경우 type 또는 variantExpr 로 지정된 path 에서 NULL 형식의 값을 추출합니다. |
variant_explode(입력) |
set중첩을 해제하여 input 개의 행을 반환합니다. |
variant_explode_outer(입력) | 외부 의미론을 사용하여 set을 중첩 해제하여 input 개의 행을 반환합니다. |
variant_get(variantExpr,path,type) |
type 가 지정한 variantExpr 에서 path 유형의 값을 추출합니다. |
XPath 및 XML 함수
함수 | 설명 |
---|---|
from_xml(xmlStr, schema[, 옵션]) |
xmlStr 를 사용하여 schema 에서 구문 분석된 구조체 값을 반환합니다. |
schema_of_xml(xmlStr[, options]) |
schema 문자열의 XML 을 DDL 형식으로 반환합니다. |
xpath(xml, xpath) |
values 노드 내에서 xml 와 일치하는 xpath 을 반환합니다. |
xpath_boolean(xml, xpath) |
true 식이 xpath 로 평가되거나 true 에서 일치하는 노드가 있으면 xml 를 반환합니다. |
xpath_double(xml, xpath) | XML 문서에서 DOUBLE 값을 반환합니다. |
xpath_float(xml, xpath) | XML 문서에서 FLOAT 값을 반환합니다. |
xpath_int(xml, xpath) | XML 문서에서 INTEGER 값을 반환합니다. |
xpath_long(xml, xpath) | XML 문서에서 BIGINT 값을 반환합니다. |
xpath_number(xml, xpath) | XML 문서에서 DOUBLE 값을 반환합니다. |
xpath_short(xml, xpath) | XML 문서에서 SHORT 값을 반환합니다. |
xpath_string(xml, xpath) | XPath 식과 일치하는 첫 번째 XML 노드의 콘텐츠를 반환합니다. |
AI 함수
함수 | 설명 |
---|---|
ai_analyze_sentiment(content) | 텍스트의 감정을 반환합니다. |
ai_classify(content, labels) | 제공된 콘텐츠를 제공된 레이블 중 하나로 분류합니다. |
ai_extract(content, labels) | 지정된 텍스트에서 레이블로 지정된 엔터티를 추출합니다. |
ai_fix_grammar(content) | 지정된 텍스트의 문법 오류를 수정합니다. |
ai_forecast(observed, time_col) | 시계열 데이터를 미래로 내세울 수 있습니다. |
ai_gen(content) | Databricks Foundation 모델 API에서 최첨단 생성 AI 모델을 호출하여 사용자가 제공한 프롬프트에 응답합니다. |
ai_generate_text(prompt, modelName[, param1, value1] [...]) | 사용되지 않음: 프롬프트가 지정된 경우 선택한 LLM(큰 언어 모델)에서 생성된 텍스트를 반환합니다. |
ai_mask(콘텐츠, 레이블) | 지정된 텍스트 내에서 지정된 엔터티를 마스크합니다. |
ai_query(endpointName, request, returnType) | 엔드포인트를 제공하는 기존 Mosaic AI 모델을 호출하고 해당 응답을 구문 분석하고 반환합니다. |
ai_similarity(strExpr1, strExpr2) | 두 문자열을 비교하고 의미 체계 유사성 점수를 계산합니다. |
ai_summarize(content[, max_words]) | 지정된 텍스트의 요약을 생성합니다. |
ai_translate(콘텐츠, to_lang) | 텍스트를 지정된 대상 언어로 변환합니다. |
vector_search(인덱스, 쿼리, num_results) | SQL을 사용하여 Mosaic AI Vector Search 인덱스 쿼리 |
Read 함수
함수 | 설명 |
---|---|
read_files(path, [optionKey => optionValue] [, ...]) | 클라우드 스토리지에서 데이터 파일을 읽고 테이블 형식으로 반환합니다. |
read_kafka([optionKey => optionValue] [, ...]) | Apache Kafka 클러스터에서 레코드를 읽고 테이블 형식으로 반환합니다. |
read_kinesis({parameter => value} [, ...]) | 하나 이상의 스트림에서 Kinesis table에서 읽은 레코드를 포함한 을 반환합니다. |
read_pubsub([parameter => value] [, ...]) | Pub/Sub의 특정 주제에서 레코드를 읽기 위한 table 값을 가진 함수입니다. |
read_pulsar({optionKey => optionValue} [, ...]) | table을 반환하여 Pulsar에서 읽은 레코드를 제공합니다. |
read_state_metadata(path) | 스트리밍 쿼리 상태의 메타데이터를 나타내는 행을 포함하는 table를 반환합니다. |
read_statestore(path [, option_key => option_value] [...]) | 스트리밍 쿼리의 상태 저장소에서 레코드를 반환합니다. |
기타 함수
함수 | 설명 |
---|---|
assert_true(expr) |
expr 이 true가 아니면 오류를 반환합니다. |
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END |
resN 과 같은 첫 번째 optN 에 대해 expr 을 반환하거나 일치하는 항목이 없으면 def 를 반환합니다. |
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END | true로 평가되는 첫 번째 resN 에 대한 condN 을 반환하거나 해당 항목이 없으면 def 를 반환합니다. |
cloud_files_state( { TABLE(table) | checkpoint } ) | 자동 로더 cloud_files 원본의 파일 수준 상태를 반환합니다. |
coalesce(expr1, expr2 [, …]) | Null이 아닌 첫 번째 인수를 반환합니다. |
데이터 정렬() | 사용 가능한 데이터 정렬의 list 반환합니다. |
cube (expr1 [, …]) | 지정된 식 columns사용하여 다차원 큐브를 만듭니다. |
current_catalog() | 현재 catalog값을 반환합니다. |
current_database() | 현재 schema값을 반환합니다. |
current_metastore() | 현재 Unity Catalog Metastore ID를 반환합니다. |
current_recipient(키) | Delta 공유와 공유된 보기에서 현재 받는 사람의 속성을 반환합니다. |
current_schema() | 현재 schema값을 반환합니다. |
current_user() | 문을 실행하는 사용자를 반환합니다. |
current_version() | 현재 버전의 Azure Databricks를 반환합니다. |
decode(expr, { key, value } [, …] [,defValue]) | 키와 일치하는 값을 반환합니다. |
elt(index, expr1 [, …] ) | nth 식을 반환합니다. |
equal_null(expr1, expr2) |
true 가 expr1 와 같거나 두 식이 모두 expr2 이면 NULL 를 반환합니다. 그렇지 않으면 false 를 반환합니다. |
event_log( { TABLE(table) | pipeline_id } ) | 구체화된 뷰, 스트리밍 table또는 DLT 파이프라인에 대한 refresh 기록의 table을(를) 반환한다. |
greatest(expr1, expr2 [, …]) | null values건너뛰고 모든 인수의 가장 큰 값을 반환합니다. |
grouping(col) | 지정된 column이 GROUPING SET , ROLLUP 또는 CUBE 의 부분합을 나타내는지 여부를 나타냅니다. |
grouping_id([col1 [, …]]) | set의 columns에 대한 그룹화 수준을 반환합니다. |
hash(expr1 [, …]) | 인수의 해시 값을 반환합니다. |
hll_sketch_estimate(expr) | HyperLogLog 스케치에서 수집된 고유 values의 개수를 추정합니다. |
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) | 두 개의 HyperLogLog 스케치를 결합합니다. |
java_method(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출합니다. |
if(cond, expr1, expr2) |
expr1 이 cond 인 경우 true 를 반환하거나 그렇지 않으면 expr2 을 반환합니다. |
iff(cond, expr1, expr2) |
expr1 이 cond 인 경우 true 를 반환하거나 그렇지 않으면 expr2 을 반환합니다. |
ifnull(expr1, expr2) |
expr2 이 expr1 인 경우 NULL 를 반환하거나 그렇지 않으면 expr1 을 반환합니다. |
input_file_block_length() | 읽는 블록의 길이(바이트)를 반환합니다. |
input_file_block_start() | 읽는 블록의 시작 offset 바이트 단위로 반환합니다. |
input_file_name() | 읽고 있는 파일의 이름을 반환하거나, 사용할 수 없는 경우 빈 문자열을 반환합니다. |
is_account_group_member(group) | 현재 사용자가 계정 수준에서 그룹의 멤버인 경우 true를 반환합니다. |
is_member(group) | 현재 사용자가 작업 영역 수준에서 그룹의 멤버인 경우 true를 반환합니다. |
isnull(expr) |
true 가 expr 이면 NULL 를 반환합니다. |
isnotnull(expr) |
true 이 expr 이 아니면 NULL 를 반환합니다. |
least(expr1, expr2 [, …]) | null values건너뛰고 모든 인수의 가장 작은 값을 반환합니다. |
list_secrets([scopeStr]) | 사용자가 Databricks 비밀 서비스에서 볼 수 있는 권한이 있는 전체 또는 하나의 범위의 키를 반환합니다. |
luhn_check(numStr) |
true 가 numStr 검사를 통과하면 를 반환합니다. |
monotonically_increasing_id() | 단조롭게 증가하는 64비트 정수를 반환합니다. |
nullif(expr1, expr2) |
NULL 이 expr1 와 같으면 expr2 을 반환하고, 그렇지 않으면 expr1 을 반환합니다. |
nvl(expr1, expr2) |
expr2 이 expr1 인 경우 NULL 를 반환하거나 그렇지 않으면 expr1 을 반환합니다. |
nvl2(expr1, expr2, expr3) |
expr2 이 expr1 이 아닌 경우 NULL 를 반환하거나 그렇지 않으면 expr3 을 반환합니다. |
raise_error(expr) |
expr 을 메시지로 사용하여 예외를 throw합니다. |
range(end) | 지정된 범위 내에서 table을(를) values로 반환합니다. |
range(start, end [, step [, numParts]]) | 지정된 범위 내에서 table을(를) values로 반환합니다. |
reflect(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출합니다. |
secret(scope, key) |
scope 에서 지정된 key 및 로 비밀 값을 추출합니다. |
session_user() | Azure Databricks에 연결된 사용자를 반환합니다. |
spark_partition_id() | 현재 partition ID를 반환합니다. |
sql_keywords() | 이 함수는 Azure Databricks에서 SQL 키워드의 set을 반환합니다. |
stack(numRows, expr1 [, …]) |
expr1 , …, exprN 을 numRows 개 행으로 구분합니다. |
table_changes(table_str, start [, end]) | 변경 데이터 피드가 사용되도록 설정된 Delta Lake table의 변경 로그를 반환합니다. |
try_reflect(class, method[, arg1 [, …]]) | 리플렉션을 사용하여 메서드를 호출하고 NULL 메서드가 실패하면 반환합니다. |
try_secret(scope, key) |
scope 에서 주어진 key 와 를 사용하여 비밀 값을 추출하거나 키를 검색할 수 없는 경우 NULL 를 추출합니다. |
typeof(expr) |
expr 데이터 형식에 대한 DDL 형식 문자열을 반환합니다. |
user() | 문을 실행하는 사용자를 반환합니다. |
uuid() | UUID(범용 고유 identifier) 문자열을 반환합니다. |
window(expr, 폭[, 단계 [, 시작]]) | 타임스탬프 식에 대한 호핑 기반 슬라이딩window 만듭니다. |
xxhash64(expr1 [, …]) | 인수의 64비트 해시 값을 반환합니다. |
version() | Apache Spark 버전을 반환합니다. |