다음을 통해 공유


기본 제공 함수

적용 대상:예로 표시된 확인 Databricks SQL 예로 표시된 확인 Databricks Runtime

이 문서에서는 문자열 및 이진 유형, 숫자 스칼라, 집계, 창, 배열, 지도, 날짜 및 타임스탬프, 캐스팅, CSV 데이터, JSON 데이터, XPath 조작 및 기타 기타 함수에 대한 기본 제공 연산자 및 함수에 대한 링크와 설명을 설명합니다.

정보 로깅 수준이 비활성화되어 있는 경우 클라이언트가 서버와 상태를 올바르게 동기화할 수 없는 오류를 수정했습니다. 사용자 정의 함수(UDF)란 무엇인가요?을 참조하세요.

또한 다음을 참조하세요.

연산자 및 조건자

서로에 대해 연산자를 구문 분석하는 방법에 대한 자세한 내용은 연산자 우선 순위를 참조하세요.

연산자 구문 설명
& expr1 & expr2 ANDexpr1의 비트 expr2을 반환합니다.
and expr1 and expr2 ANDexpr1의 논리적 expr2을 반환합니다.
* multiplier * multiplicand multipliermultiplicand를 곱한 값을 반환합니다.
!= expr1 != expr2 expr1expr2와 같지 않으면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
! !expr 부울 식의 논리적 NOT을 반환합니다.
between expr1 [not] between expr2 and expr2 expr1expr2보다 크거나 같은지, expr3보다 작거나 같은지 테스트합니다.
[ ] arrayExpr [ indexExpr ] indexExpr ARRAY의 요소 arrayExprnd를 반환합니다.
[ ] mapExpr [ keyExpr ] keyExpr MAPmapExpr에서 값을 반환합니다.
^ expr1 ^ expr2 OR (XOR)expr1의 배타적 비트 expr2을 반환합니다.
: jsonStr : jsonPath jsonStr에서 추출된 필드를 반환합니다.
:: expr :: type expr을 대상 데이터 형식 type으로 캐스트합니다.
?:: expr ?:: type 가능하면 목표 데이터 유형 expr에 값 type를 캐스팅하고 그렇지 않으면 NULL를 반환합니다.
div dividend div divisor dividenddivisor로 나눈 값의 정수 부분을 반환합니다.
. mapExpr . keyIdentifier MAP에서 keyIdentifier 값을 반환합니다.
. structExpr . fieldIdentifier STRUCT에서 fieldIdentifier 필드를 반환합니다.
== expr1 == expr2 trueexpr1와 같으면 expr2을 반환하고, 그렇지 않으면 false을 반환합니다.
= expr1 = expr2 trueexpr1와 같으면 expr2을 반환하고, 그렇지 않으면 false을 반환합니다.
>= expr1 >= expr2 trueexpr1보다 크거나 같으면 expr2를 반환하고, 그렇지 않으면 false를 반환합니다.
> expr1 > expr2 trueexpr1보다 크면 expr2를 반환하고, 그렇지 않으면 false를 반환합니다.
exists exists(query) query에서 하나 이상의 행을 반환하면 true를 반환하고, 그렇지 않으면 false를 반환합니다.
ilike str [not] ilike (pattern[ESCAPE escape]) str이 대/소문자를 구분하지 않고 patternescape가 일치하지 않으면 true를 반환합니다.
ilike str [not] ilike {ANY\|SOME\|ALL}([pattern[, ...]]) str이 대/소문자를 구분하지 않고 일부/모든 패턴과 일치하지 않으면 true를 반환합니다.
in elem [not] in (expr1[, ...]) trueelem과 같지 않으면 exprN를 반환합니다.
in elem [not] in (query) trueelem의 행과 같지 않으면 query를 반환합니다.
is distinct expr1 is [not] distinct from expr2 인수에 서로 다른 valueswhereNULL가 (없는지) 있는지 여부를 테스트하는 것은 비교 가능한 values으로 간주됩니다.
is false expr is [not] false exprfalse인지 여부를 테스트합니다.
is null expr is [not] null trueexpr인지 여부에 관계없이 NULL를 반환합니다.
is true expr is [not] true exprtrue인지 여부를 테스트합니다.
like str [not] like (pattern[ESCAPE escape]) strpatternescape가 일치하지 않으면 true를 반환합니다.
like str [not] like {ANY\|SOME\|ALL}([pattern[, ...]]) str이 일부/모든 패턴과 일치하지 않으면 true를 반환합니다.
<=> expr1 <=> expr2 null이 아닌 피연산자의 경우 EQUAL(=)과 동일한 결과를 반환하지만, 둘 다 true이면 NULL를 반환하고 둘 중 하나가 false이면 NULL를 반환합니다.
<= expr1 <= expr2 trueexpr1보다 작거나 같으면 expr2를 반환하고, 그렇지 않으면 false를 반환합니다.
<> expr1 <> expr2 trueexpr1와 같지 않으면 expr2를 반환하고, 그렇지 않으면 false를 반환합니다.
< expr1 < expr2 trueexpr1보다 작으면 expr2를 반환하고 그렇지 않으면 false를 반환합니다.
- expr1 - expr2 expr2에서 expr1를 뺀 값을 반환합니다.
not not expr 부울 식의 논리적 NOT을 반환합니다.
or expr1 or expr2 ORexpr1의 논리적 expr2을 반환합니다.
% dividend % divisor dividend / divisor 이후의 나머지를 반환합니다.
|| expr1 \|\| expr2 expr1expr2의 연결을 반환합니다.
| expr1 \| expr2 ORexpr1의 비트 expr2을 반환합니다.
+ expr1 + expr2 expr1expr2의 합계를 반환합니다.
regexp str [not] regexp regex strregex와 일치하지 않으면 true를 반환합니다.
regexp_like str [not] regexp_like regex strregex와 일치하지 않으면 true를 반환합니다.
rlike str [not] rlike regex strregex와 일치하지 않으면 true를 반환합니다.
/ dividend / divisor dividend로 나눈 divisor 값을 반환합니다.
~ ~ expr NOT의 비트 단위 expr을 반환합니다.

연산자 우선 순위

우선 순위 연산자
1 :, ::, ?::[ ]
2 -(단항), +(단항), ~
3 *, /, %div
4 +, , -\|\|
5 &
6 ^
7 \|
8 =,==, <=>, <>, !=, <<=, >>=
9 not, exists
10 between, in, rlike, regexp, ilike, like, is [not] [NULL, true, false]is [not] distinct from
11 and
12 or

문자열 및 이진 함수

함수 설명
expr1 || expr2 expr1expr2의 연결을 반환합니다.
aes_decrypt(expr, key[, mode[, padding[, aad]]]) AES 암호화를 사용하여 expr 이진 파일의 암호를 해독합니다.
aes_encrypt(expr, key[, mode[, padding[, iv[, aad]]]]) AES 암호화를 사용하여 expr 이진 파일을 암호화합니다.
ascii(str) str의 첫 번째 문자에 대한 ASCII 코드 포인트를 반환합니다.
base64(expr) expr을 기본 64 문자열로 변환합니다.
bin(expr) expr의 이진 표현을 반환합니다.
binary(expr) expr의 값을 BINARY로 캐스팅합니다.
bit_length(expr) 문자열 데이터의 비트 길이 또는 이진 데이터의 비트 수를 반환합니다.
bitmap_count(expr) 비트맵을 나타내는 BINARY 문자열에서 set 비트 수를 반환합니다.
btrim(str [, trimStr]) 선행 및 후행 문자가 제거된 str을 반환합니다.
char(expr) 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다.
char_length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
character_length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
charindex(substr, str[, pos]) substr 위치 다음의 str에서 pos이 처음 나타나는 위치를 반환합니다.
chr(expr) 제공된 UTF-16 코드 포인트에 있는 문자를 반환합니다.
strExpr collate collationName 명시적 정렬 collationName을(를) strExpr에 연결합니다.
데이터 정렬 [for](strExpr) strExpr에 부착된 콜레이션을 반환합니다.
concat(expr1, expr2[, …]) 인수의 연결을 반환합니다.
concat_ws(sep[, expr1[, …]]) sep로 구분된 연결 문자열을 반환합니다.
contains(expr, subExpr) true expr 또는 STRINGBINARY가 포함되어 있으면 subExpr를 반환합니다.
crc32(expr) expr의 순환 중복 검사 값을 반환합니다.
decode(expr, charSet) 문자 set 인코딩 charSet사용하여 이진 expr 문자열로 변환합니다.
encode(expr, charSet) charSet 문자 인코딩을 사용하여 문자열의 이진 표현을 반환합니다.
endswith(expr, endExpr) true expr 또는 STRINGBINARY로 끝나면 endExpr를 반환합니다.
find_in_set(searchExpr, sourceExpr) 문자열의 쉼표로 구분된 list 내에서 문자열의 위치를 반환합니다.
format_number(expr, scale) expr의 형식이 #,###,###.## 소수 자릿수로 반올림되는 scale과 같습니다.
format_number(expr, fmt) expr의 형식이 fmt과 같습니다.
format_string(strfmt[, obj1 [, …]]) printf 스타일 형식 문자열의 형식 문자열을 반환합니다.
hex(expr) expr을 16진수로 변환합니다.
str ilike (pattern[ESCAPE escape]) str이 대/소문자를 구분하지 않고 pattern가 있는 escape과 일치하면 true를 반환합니다.
initcap(expr) 각 단어의 첫 글자가 대문자인 expr을 반환합니다.
instr(str, substr) substr에서 str의 첫 번째 항목에 대한 인덱스(1부터 시작)를 반환합니다.
lcase(expr) 모든 문자가 소문자로 변경된 expr을 반환합니다.
left(str, len) len에서 맨 왼쪽 str 문자를 반환합니다.
len(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
length(expr) 문자열 데이터의 문자 길이 또는 이진 파일 데이터의 바이트 수를 반환합니다.
levenshtein(str1, str2) str1str2 문자열 사이의 Levenshtein 거리를 반환합니다.
str like (pattern[ESCAPE escape]) strpatternescape가 일치하면 true를 반환합니다.
locate(substr, str[, pos]) substr 위치 다음의 str에서 pos이 처음 나타나는 위치를 반환합니다.
lower(expr) 모든 문자가 소문자로 변경된 expr을 반환합니다.
lpad(expr, len[, pad]) 길이가 exprpad로 왼쪽 패딩된 len을 반환합니다.
ltrim([trimstr,] str) str이 제거된 선행 문자를 사용하여 trimStr을 반환합니다.
mask(str[, upperChar[, lowerChar[, digitChar[, otherChar]]]]) 마스킹된 버전의 입력 str을 반환합니다.
md5(expr) expr의 MD5 128비트 체크섬을 16진수 문자열로 반환합니다.
octet_length(expr) 문자열 데이터의 바이트 길이 또는 이진 데이터의 바이트 수를 반환합니다.
overlay(input PLACING replace FROM pos [FOR len]) input에서 시작되고 길이가 replaceposlen을 바꿉니다.
overlay(input PLACING replace FROM pos [FOR len]) input에서 시작되고 길이가 replaceposlen을 바꿉니다.
parse_url(url, partToExtract[, key]) url에서 일부를 추출합니다.
position(substr, str[, pos]) substr 위치 다음의 str에서 pos이 처음 나타나는 위치를 반환합니다.
position(subtr IN str) substr 위치 다음의 str에서 pos이 처음 나타나는 위치를 반환합니다.
printf(strfmt[, obj1 [, …]]) printf 스타일 형식 문자열의 형식 문자열을 반환합니다.
randstr(length) length 알파 숫자 문자의 임의 문자열을 반환합니다.
str regexp regex strregex와 일치하면 true를 반환합니다.
str regexp_like regex strregex와 일치하면 true를 반환합니다.
regexp_count(str, regexp) strregexp 패턴과 일치하는 횟수를 반환합니다.
regexp_extract(str, regexp[, idx]) str에서 regexp 식과 일치하고 regex 그룹 인덱스에 해당하는 첫 번째 문자열을 추출합니다.
regexp_extract_all(str, regexp[, idx]) str 식과 일치하고 regexp 그룹 인덱스에 해당하는 regex의 모든 문자열을 추출합니다.
regexp_instr(str, regexp) str와 일치하는 regexp의 첫 번째 하위 문자열 위치를 반환합니다.
regexp_replace(str, regexp, rep[, position]) str와 일치하는 regexp의 모든 부분 문자열을 rep로 대체합니다.
regexp_substr(str, regexp) str와 일치하는 regexp의 첫 번째 하위 문자열을 반환합니다.
repeat(expr, n) expr n를 여러 번 반복하는 문자열을 반환합니다.
바꾸기(str, search [, replace]) search의 모든 항목을 replace로 바꿉니다.
reverse(expr) 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다.
right(str, len) 문자열 len에서 가장 오른쪽에 있는 str 문자를 반환합니다.
str rlike regex strregex와 일치하면 true를 반환합니다.
rpad(expr, len[, pad]) 길이가 exprpad로 오른쪽 패딩된 len을 반환합니다.
rtrim([trimStr,] str) 후행 문자가 제거된 str을 반환합니다.
sentences(str[, lang, country]) str을 단어 배열의 배열로 분할합니다.
sha(expr) sha1 해시 값을 expr의 16진수 문자열로 반환합니다.
sha1(expr) sha1 해시 값을 expr의 16진수 문자열로 반환합니다.
sha2(expr, bitLength) SHA-2 제품군의 체크섬을 expr의 16진수 문자열로 반환합니다.
soundex(expr) 문자열의 soundex 코드를 반환합니다.
space(n) n개의 공백으로 구성된 문자열을 반환합니다.
split(str, regex[, limit]) str와 일치하는 항목을 중심으로 regex을 분할하고 길이가 최대 limit인 배열을 반환합니다.
split_part(str, delim, partNum) str의 발생 항목을 기준으로 delim을 분할하고 partNum 파트를 반환합니다.
startswith(expr, startExpr) true expr 또는 STRINGBINARY로 시작하면 startExpr를 반환합니다.
string(expr) exprSTRING로 캐스팅합니다.
substr(expr, pos[, len]) expr에서 시작되고 길이가 poslen의 하위 문자열을 반환합니다.
substr(expr FROM pos[ FOR len]) expr에서 시작되고 길이가 poslen의 하위 문자열을 반환합니다.
substring(expr, pos[, len]) expr에서 시작되고 길이가 poslen의 하위 문자열을 반환합니다.
substring(expr FROM pos[ FOR len]) expr에서 시작되고 길이가 poslen의 하위 문자열을 반환합니다.
substring_index(expr, delim, count) 구분 기호 exprcount개 발생하기 전에 delim의 부분 문자열을 반환합니다.
to_binary(expr[, fmt]) expr에 따라 이진 파일로 캐스팅된 fmt를 반환합니다.
to_char(numExpr, fmt) numExpr 형식을 사용하여 STRINGfmt로 반환합니다.”
to_varchar(numExpr, fmt) numExpr 형식을 사용하여 STRINGfmt로 반환합니다.”
translate(expr, from, to) expr where은 from의 모든 문자를 to에 있는 문자로 대체하여 반환합니다.
trim([[BOTH | LEADING | TRAILING] [trimStr] FROM] str) 문자열에서 문자를 자릅니다.
try_aes_decrypt(expr, key[, mode[, padding[, aad]]]) AES 암호화를 사용하여 이진 expr를 복호화하고 오류가 있는 경우 NULL를 반환합니다.
try_to_binary(expr [, fmt]) 입력이 유효하지 않으면 expr를 기준으로 BINARYfmt로, 입력이 유효하지 않으면 NULL로 형변환하여 반환합니다.
try_url_decode(str) application/x-www-form-urlencoded 형식에서 문자열을 다시 변환하고 오류가 있는 경우 NULL를 반환합니다.
try_zstd_decompress(value) Zstandard 압축으로 압축 해제된 값을 반환하거나 입력이 유효하지 않은 경우 NULL를 반환합니다.
ucase(expr) 모든 문자가 대문자로 변경된 expr을 반환합니다.
unbase64(expr) 디코딩된 base64 문자열을 이진 형식으로 반환합니다.
unhex(expr) 16진수 exprBINARY로 변환합니다.
upper(expr) 모든 문자가 대문자로 변경된 expr을 반환합니다.
url_decode(str) 문자열을 application/x-www-form-urlencoded 형식에서 다시 변환합니다.
url_encode(str) 문자열을 application/x-www-form-urlencoded 형식으로 변환합니다.
zstd_compress (value[,level[,streaming_mode]]) Zstandard 압축을 사용하여 압축된 값을 반환합니다.
zstd_decompress(value) Zstandard 압축으로 압축 해제된 값을 반환합니다.

숫자 스칼라 함수

함수 설명
~ expr NOT의 비트 단위 expr을 반환합니다.
dividend / divisor dividend로 나눈 divisor 값을 반환합니다.
expr1 | expr2 ORexpr1의 비트 expr2을 반환합니다.
- expr expr의 부정 값을 반환합니다.
expr1 - expr2 expr2에서 expr1를 뺀 값을 반환합니다.
+ expr expr의 값을 반환합니다.
expr1 + expr2 expr1expr2의 합계를 반환합니다.
dividend % divisor dividend / divisor 이후의 나머지를 반환합니다.
expr1 ^ expr2 OR (XOR)expr1의 배타적 비트 expr2을 반환합니다.
expr1 & expr2 ANDexpr1의 비트 expr2을 반환합니다.
multiplier * multiplicand multipliermultiplicand를 곱한 값을 반환합니다.
abs(expr) expr에서 숫자 값의 절대값을 반환합니다.
acos(expr) expr의 역 코사인(아크코사인)을 반환합니다.
acosh(expr) expr의 역쌍곡 코사인 값을 반환합니다.
asin(expr) expr의 역사인(아크사인) 값을 반환합니다.
asinh(expr) expr의 하이퍼볼릭 역 사인 값을 반환합니다.
atan(expr) expr의 역탄젠트(아크탄젠트)를 반환합니다.
atan2(exprY, exprX) 평면의 양의 x축과 좌표(exprX, exprY)로 지정된 점 사이의 각도를 라디안 단위로 반환합니다.
atanh(expr) expr의 하이퍼볼릭 역 탄젠트 값을 반환합니다.
bigint(expr) exprBIGINT로 캐스팅합니다.
bit_count(expr) 인수에서 set의 비트 수를 반환합니다.
bit_get(expr, pos) 정수 숫자의 이진 표현에서 비트 값을 반환합니다.
bit_reverse(expr) 인수의 비트 순서를 반대로 하여 얻은 값을 반환합니다.
bitmap_bit_position(expr) 버킷 내에서 주어진 BIGINT 숫자의 0 기준 비트 위치를 반환합니다.
bitmap_bucket_number(expr) 주어진 BIGINT 숫자에 대한 비트맵 버킷 번호를 반환합니다.
bround(expr[,targetScale]) expr 반올림 모드를 사용하여 반올림된 HALF_EVEN을 반환합니다.
cbrt(expr) expr의 세제곱근을 반환합니다.
ceil(expr[,targetScale]) 소수점을 기준으로 expr자리까지 반올림된 targetScale보다 작지 않으면서, 가장 작은 수를 반환합니다.
ceiling(expr[,targetScale]) 소수점을 기준으로 expr자리까지 반올림된 targetScale보다 작지 않으면서, 가장 작은 수를 반환합니다.
conv(num, fromBase, toBase) numfromBase에서 toBase로 변환합니다.
convert_timezone([sourceTz, ]targetTz, sourceTs) TIMESTAMP_NTZ 시간대의 sourceTssourceTztargetTz로 변환합니다.
cos(expr) expr의 코사인을 반환합니다.
cosh(expr) expr의 하이퍼볼릭 코사인을 반환합니다.
cot(expr) expr의 코탄젠트를 반환합니다.
csc(expr) expr의 코시컨트를 반환합니다.
decimal(expr) exprDECIMAL로 캐스팅합니다.
degrees(expr) 라디안을 도로 변환합니다.
divisor div dividend divisordividend로 나눈 값의 정수 부분을 반환합니다.
double(expr) exprDOUBLE로 캐스팅합니다.
e() e 상수를 반환합니다.
exp(expr) eexpr제곱을 반환합니다.
expm1(expr) exp(expr) - 1을(를) 반환합니다.
factorial(expr) expr의 계승을 반환합니다.
float(expr) exprFLOAT로 캐스팅합니다.
floor(expr[,targetScale]) 소수점을 기준으로 expr자리까지 반올림하여 targetScale보자 작지 않은 가장 큰 수를 반환합니다.
getbit(expr, pos) 정수 숫자의 이진 표현에서 비트 값을 반환합니다.
hypot(expr1, expr2) sqrt(expr1 * expr1 + expr2 * expr2)을(를) 반환합니다.
int(expr) exprINTEGER로 캐스팅합니다.
isnan(expr) trueexpr이면 NaN를 반환합니다.
ln(expr) e의 자연 로그(밑 expr)를 반환합니다.
log([base,] expr) expr를 사용하여 base의 로그를 반환합니다.
log1p(expr) log(1 + expr)을(를) 반환합니다.
log2(expr) 밑이 expr2의 로그를 반환합니다.
log10(expr) 밑이 expr10의 로그를 반환합니다.
mod(dividend, divisor) dividend / divisor 이후의 나머지를 반환합니다.
nanvl(expr1, expr2) expr1이 아니면 NaN을 반환하고, 그렇지 않으면 expr2를 반환합니다.
negative(expr) expr의 부정 값을 반환합니다.
'nullifzero(expr)' expr 0 NULL 이 아니면 반환합니다.
pi() pi를 반환합니다.
pmod(dividend, divisor) dividend / divisor 이후의 양수 나머지를 반환합니다.
positive(expr) expr의 값을 반환합니다.
pow(expr1, expr2) 지수가 expr1expr2의 거듭제곱을 계산합니다.
power(expr1, expr2) 지수가 expr1expr2의 거듭제곱을 계산합니다.
radians(expr) 도 단위 expr을 라디안으로 변환합니다.
rand([seed]) 0에서 1 사이의 임의 값을 반환합니다.
randn([seed]) 표준 정규 분포에서 임의 값을 반환합니다.
random([seed]) 0에서 1 사이의 임의 값을 반환합니다.
rint(expr) expr를 정수로 반올림하여 DOUBLE로 반환합니다.
round(expr[,targetScale]) expr 반올림 모드를 사용하여 반올림된 HALF_UP을 반환합니다.
sec(expr) expr의 시컨트를 반환합니다.
shiftleft(expr, n) n 비트 단위로 왼쪽으로 이동한 비트를 반환합니다.
shiftright(expr, n) n비트만큼 오른쪽으로 이동한 비트 부호 있는 부호 있는 정수를 반환합니다.
shiftrightunsigned(expr, n) n비트로 오른쪽으로 이동된 비트 부호 없는 부호 있는 정수를 반환합니다.
sign(expr) expr이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다.
signum(expr) expr이 음수, 0 또는 양수이므로 -1.0, 0.0 또는 1.0을 반환합니다.
sin(expr) expr의 사인을 반환합니다.
sinh(expr) expr의 하이퍼볼릭 사인을 반환합니다.
smallint(expr) exprSMALLINT로 캐스팅합니다.
sqrt(expr) expr의 제곱근을 반환합니다.
tan(expr) expr의 탄젠트를 반환합니다.
tanh(expr) expr의 하이퍼볼릭 탄젠트를 반환합니다.
tinyint(expr) expr에서 TINYINT로 캐스트.
to_number(expr, fmt ) expr 형식을 사용하여 DECIMALfmt로 반환합니다.
try_add(expr1, expr2) expr1expr2의 합계 또는 오류가 있는 경우 NULL를 반환합니다.
try_divide(dividend, divisor) dividenddivisor로 나눈 값 또는 NULL가 0이면 divisor를 반환합니다.
try_mod(dividend, divisor) dividend / divisor를 제외한 나머지를 반환하거나 NULL가 0이면 divisor를 반환합니다.
try_multiply(multiplier, multiplicand) multipliermultiplicand의 곱 또는 오버플로의 NULL을 반환합니다.
try_subtract(expr1, expr2) expr2에서 expr1를 뺀 값이나, 오버플로에 대해 NULL을 반환합니다.
try_to_number(expr, fmt ) 형식 expr를 사용하여 DECIMALfmt로 변환하거나, NULL가 형식과 일치하지 않으면 expr로 변환합니다.
uniform(expr1, expr2 [,seed]) 지정된 숫자 범위 내에서 독립적이고 동일하게 분산된 values 있는 임의 값을 반환합니다.
width_bucket(expr, minExpr, maxExpr, numBuckets) 등 너비 히스토그램의 값에 대한 버킷 번호를 반환합니다.
'zeroifnull(expr)' 그렇지 않은 경우 반환하거나 expr 그렇지 않은 NULL경우 반환 0 합니다.

집계 함수

함수 설명
any(expr) 그룹에서 expr의 값 중 하나 이상이 true이면 true를 반환합니다.
any_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 일부 값을 반환합니다.
approx_count_distinct(expr[,relativeSD]) 그룹 내의 expr에서 서로 다른 values의 예상 수를 반환합니다.
approx_percentile(expr,percentage[,accuracy]) 그룹 내 expr의 백분위수 근사치를 반환합니다.
approx_top_k(expr[,k[,maxItemsTracked]]) 대략적인 개수와 함께 exprvalues 가장 자주 발생하는 상위 k 항목을 반환합니다.
array_agg(expr) 그룹 내의 expr에 있는 모든 values으로 이루어진 배열을 반환합니다.
avg(expr) 그룹의 values에서 계산된 평균을 반환합니다.
bit_and(expr) 그룹 내 모든 입력 values에 대해 비트 연산 AND 결과를 반환합니다.
bit_or(expr) 그룹 내 모든 입력 values에 대해 비트 연산 OR을 반환합니다.
bit_xor(expr) 그룹 내 모든 입력 values에 대한 비트 연산의 결과인 XOR를 반환합니다.
bitmap_construct_agg(expr) 비트 위치 values의 모든 비트에 대해 비트 연산 OR을 반환합니다. 그룹에서 0에서 32767 사이의 값을 BINARY로 지정합니다.
bitmap_or_agg(expr) 모든 BINARY 입력 values에 대한 비트 연산 OR을(를) 그룹에서 반환합니다.
bool_and(expr) expr 내의 모든 values가 참이면 true를 반환합니다.
bool_or(expr) 그룹 내에서 expr에 하나 이상의 값이 true이면 true를 반환합니다.
collect_list(expr) 그룹 내의 expr에 있는 모든 values로 구성된 배열을 반환합니다.
collect_set(expr) 모든 고유 values으로 구성된 배열을 그룹 내의 expr에서 반환합니다.
corr(expr1,expr2) 숫자 쌍 그룹 간의 피어슨 상관 관계 계수를 반환합니다.
count(*) null이 있는 행을 포함하여 그룹에서 검색된 총 행 수를 반환합니다.
count(expr[, …]) 제공된 식이 모두 null이 아닌 그룹의 행 수를 반환합니다.
count_if(expr) expr그룹의 true values 개수를 반환합니다.
count_min_sketch(column,epsilon,confidence,seed) epsilon, confidenceseed를 사용하여 column 그룹에 있는 모든 values의 카운트-민 스케치를 반환합니다.
covar_pop(expr1,expr2) 그룹에 있는 숫자 쌍의 모집단 공 분산을 반환합니다.
covar_samp(expr1,expr2) 그룹에 있는 숫자 쌍의 표본 공 분산을 반환합니다.
every(expr) 조건: 그룹의 모든 exprvalues가 true인 경우, 결과로 true를 반환합니다.
first(expr[,ignoreNull]) 행 그룹에 대한 expr의 첫 번째 값을 반환합니다.
first_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 첫 번째 값을 반환합니다.
histogram_numeric(expr,numBins) expr 구간차원을 가진 numBins에 대한 히스토그램을 계산하여 구간차원 중심을 나타내는 쌍의 배열을 반환합니다.
hll_sketch_agg(expr[,lgConfigK]) 고유한 values 개수를 근사하는 데 사용되는 HyperLogLog 스케치를 반환합니다.
hll_union_agg(expr[,allowDifferentLgConfigK]) 행 그룹에 대한 HyperLogLog 스케치를 집계합니다.
kurtosis(expr) 그룹의 values에서 계산된 첨도 값을 반환합니다.
last(expr[,ignoreNull]) 행 그룹에 대한 expr의 마지막 값을 반환합니다.
last_value(expr[,ignoreNull]) 행 그룹에 대한 expr의 마지막 값을 반환합니다.
max(expr) 그룹의 expr 최댓값을 반환합니다.
max_by(expr1,expr2) 그룹의 expr1 최댓값과 연결된 expr2의 값을 반환합니다.
mean(expr) 그룹의 values 계산된 평균을 반환합니다.
median(expr) 그룹의 values에서 계산된 중앙값을 반환합니다.
min(expr) 그룹에서 expr의 최솟값을 반환합니다.
min_by(expr1, expr2) 그룹의 최솟값 expr1와 연결된 expr2 값을 반환합니다.
mode(expr [,deterministic]) 그룹에서 가장 빈번한 NULL 값이 아닌 expr 값을 반환합니다.
percentile(expr, percentage [,frequency]) 지정된 expr에서 percentage의 정확한 백분위수 값을 반환합니다.
percentile_approx(expr,percentage[,accuracy]) 그룹 내 expr의 백분위수 근사치를 반환합니다.
percentile_cont(pct) WITHIN GROUP(ORDER BY 키) 그룹 내에서 보간된 key의 백분위수를 반환합니다.
percentile_disc(pct) WITHIN GROUP(ORDER BY 키) 그룹 내의 key에 대한 불연속 백분위수를 반환합니다.
regr_avgx(yExpr, xExpr) 그룹 where에서 values으로 계산된 xExpr의 평균을 반환하며,xExpryExpr은(는) NOT NULL입니다.
regr_avgy(yExpr, xExpr) 그룹 wherexExpr에 속한 values로부터 계산된 yExpr의 평균을 반환하며, yExprNOT NULL입니다.
regr_count(yExpr, xExpr) 그룹에 있는 Null이 아닌 값 쌍 yExpr, xExpr의 개수를 반환합니다.
regr_intercept(yExpr, xExpr) 그룹 내 유니변량 선형 회귀선의 절편을 반환하며, where,xExpr, 그리고 yExpr가 NULL이 아님을 조건으로 합니다.
regr_r2(yExpr, xExpr) 그룹 where,xExpr 및 values의 결정 계수를 반환하며, 이때 yExpr는 NULL이 아닙니다.
regr_slope(yExpr, xExpr) 그룹에서 null이 아닌 값 쌍 yExpr, xExpr의 선형 회귀선의 기울기를 반환합니다.
regr_sxx(yExpr, xExpr) 그룹 wherexExprxExprvalues 제곱 합계를 반환하며, yExpr가 NULL이 아니어야 합니다.
regr_sxy(yExpr, xExpr) 그룹 wherexExpr의 values에서 yExprxExpr의 곱을 계산하여 yExprNOT NULL의 합계를 반환합니다.
regr_syy(yExpr, xExpr) 그룹 wherexExpryExpr및values 제곱의 합계를 반환하며 yExpr가 NULL이 아닙니다.
schema_of_json_agg(json[, options]) 그룹 내 JSON 문자열을 결합한 결과를 DDL 형식으로 schema로 반환합니다.
schema_of_variant_agg(variantExpr) DDL 형식으로 그룹 내의 모든 VARIANTvalues의 결합된 schema를 반환합니다.
skewness(expr) 그룹의 values에서 계산된 왜도 값을 반환합니다.
some(expr) 그룹에서 하나 이상의 expr 값이 true이면 true를 반환합니다.
std(expr) 그룹 내 values에서 계산된 샘플 표준 편차를 반환합니다.
stddev(expr) 그룹 내의 values에서 계산된 샘플 표준 편차를 반환합니다.
stddev_pop(expr) values에서 계산한 그룹의 모집단 표준 편차를 반환합니다.
stddev_samp(expr) values에서 계산된 그룹의 샘플 표준 편차를 반환합니다.
sum(expr) 그룹의 values에서 계산된 합계를 반환합니다.
try_avg(expr) 그룹의 values에서 계산된 평균을 반환하며, 오버플로가 있는 경우 NULL을 반환합니다.
try_sum(expr) 오버플로가 없는 경우 그룹의 values에서 계산된 합계를 반환하며, 오버플로가 있는 경우 NULL에서 반환합니다.
var_pop(expr) 그룹의 values에서 계산한 모집단 분산을 반환합니다.
var_samp(expr) 그룹의 values에서 계산된 샘플 분산을 반환합니다.
variance(expr) 그룹의 values에서 샘플 분산을 계산하여 반환합니다.

window 함수 순위 지정

함수 설명
dense_rank() partition에서 모든 values과 비교하여 값의 순위를 반환합니다.
ntile(n) 각 windowpartition 행을 1에서 최대 n범위의 n 버킷으로 나눕니다.
percent_rank() partition내 값의 백분율 순위를 계산합니다.
rank() partition에서 모든 values와 비교하여 값의 순위를 반환합니다.
row_number() window partition내의 행 순서에 따라 각 행에 처음부터 1로 시작하여 고유한 순차 번호를 할당합니다.

분석 window 함수

함수 설명
cume_dist() 값이 partition에서 모든 values에 상대적으로 위치하는 위치를 반환합니다.
lag(expr[,offset[,default]]) partition내의 이전 행에서 expr 값을 반환합니다.
lead(expr[,offset[,default]]) partition내의 후속 행에서 expr 값을 반환합니다.
nth_value(expr, offset[, ignoreNulls]) window의 offset에서 특정 expr 값을 반환합니다.

배열 함수

함수 설명
arrayExpr[indexExpr] indexExpr ARRAY의 arrayExpr 위치에 있는 요소를 반환합니다.
aggregate(expr,start,merge[,finish]) 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다.
array([expr [, …]]) expr의 요소가 있는 배열을 반환합니다.
array_append(array, elem) array에 의해 추가된 elem 값을 반환합니다.
array_compact(array) array에서 NULL values을 제거합니다.
array_contains(array,value) arrayvalue가 포함되어 있으면 true를 반환합니다.
array_distinct(array) array에서 중복된 values을 제거합니다.
array_except(array1,array2) array1에는 있지만 array2에는 없는 요소의 배열을 반환합니다.
array_insert(array, index, elem) 확장된 arraywhereelemindex 위치에 삽입된 상태로 반환됩니다.
array_intersect(array1,array2) array1array2의 교집합에 있는 요소의 배열을 반환합니다.
array_join(array,delimiter[,nullReplacement]) array의 요소를 연결합니다.
array_max(array) array의 최댓값을 반환합니다.
array_min(array) array의 최솟값을 반환합니다.
array_position(array,element) element에서 처음으로 나오는 array의 위치를 반환합니다.
array_prepend(array, elem) array가 앞에 붙은 elem를 반환합니다.
array_remove(array,element) element에서 array의 모든 항목을 제거합니다.
array_repeat(element,count) element count회가 포함된 배열을 반환합니다.
array_size(array) array의 요소 수를 반환합니다.
array_sort(array,func) array에 따라 정렬된 func를 반환합니다.
array_union(array1,array2) array1array2의 합집합에 있는 요소의 배열을 중복 없이 반환합니다.
arrays_overlap(array1, array2) array1array2의 교집합이 비어 있지 않으면 true를 반환합니다.
arrays_zip(array1 [, …]) 입력 배열의 모든 n번째 values을 포함하는 nth 구조체가 포함된 구조체의 병합된 배열을 반환합니다.
cardinality(expr) expr의 크기를 반환합니다.
concat(expr1, expr2 [, …]) 인수의 연결을 반환합니다.
element_at(arrayExpr, index) arrayExpr에 있는 index의 요소를 반환합니다.
exists(expr, pred) predexpr의 모든 요소에 대해 true이면 true를 반환합니다.
explode(collection) collection 중첩을 해제하여 행을 반환합니다.
explode_outer(collection) 외부 의미 체계를 사용하는 collection의 중첩을 해제하여 행을 반환합니다.
filter(expr,func) expr 함수를 사용하여 func의 배열을 필터링합니다.
flatten(arrayOfArrays) 배열의 배열을 단일 배열로 변환합니다.
forall(expr, predFunc) predFunc이 배열의 모든 요소에 대해 유지되는지 여부를 테스트합니다.
get(arrayExpr, index) arrayExpr에서 index부터 0의 요소를 반환합니다.
인라인(입력) 구조체 배열을 table으로 세분화합니다.
inline_outer(입력) 구조체 배열을 외부 의미 체계로 table로 확장합니다.
posexplode(collection) 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다.
posexplode_outer(컬렉션) OUTER 의미 체계를 사용하여 위치 번호가 지정된 배열의 중첩을 해제하여 행을 반환합니다.
reduce(expr,start,merge[,finish]) 사용자 지정 집계기를 사용하여 배열의 요소를 집계합니다.
reverse(array) 반전된 문자열 또는 요소의 순서가 반전된 배열을 반환합니다.
sequence(start,stop,step) start에서 stop(포함)까지의 요소의 배열을 생성하고 step 단위로 증분합니다.
shuffle(array) expr에서 배열의 임의 순열을 반환합니다.
size(expr) expr의 카디널리티를 반환합니다.
slice(expr,start,length) 배열의 하위 집합을 반환합니다.
sort_array(expr[,ascendingOrder]) expr의 배열을 정렬 순서로 반환합니다.
transform(expr, func) expr 함수를 사용하여 func에 있는 배열의 요소를 변환합니다.
try_element_at(arrayExpr, index) arrayExprindex 요소 또는 NULL(index가 경계를 벗어난 경우)을 반환합니다.
zip_with(expr1, expr2, func) expr1을 사용하여 expr2func의 배열을 요소 단위로 단일 배열로 병합합니다.

Map 함수

함수 설명
mapExpr[keyExpr] keyExpr MAP의 mapExpr에 있는 값을 반환합니다.
cardinality(expr) expr의 크기를 반환합니다.
element_at(mapExpr, key) mapExprkey 값을 반환합니다.
explode(collection) expr 중첩을 해제하여 행을 반환합니다.
explode_outer(collection) 외부 의미 체계를 사용하는 expr의 중첩을 해제하여 행을 반환합니다.
map([{key1, value1}[, …]]) 지정된 키-값 쌍을 사용하여 맵을 만듭니다.
map_concat([expr1 [, …]]) 모든 expr 맵 식의 합집합을 반환합니다.
map_contains_key(map, key) truemap가 포함된 경우 key를 반환하고 아닌 경우 false를 반환합니다.
map_entries(map) map에 있는 모든 항목의 순서가 지정되지 않은 배열을 반환합니다.
map_filter(expr, func) expr 함수를 사용하여 func에서 맵의 항목을 필터링합니다.
map_from_arrays(키, values) 한 쌍의 keysvalues 배열을 사용하여 맵을 만듭니다.
map_from_entries(expr) 지정된 항목 배열에서 만들어진 맵을 만듭니다.
map_keys(map) map의 키를 포함하는 정렬되지 않은 배열을 반환합니다.
map_values(map) map의 values를 포함하는 순서가 없는 배열을 반환합니다.
map_zip_with(map1, map2, func) map1map2를 단일 맵으로 병합합니다.
size(expr) expr의 카디널리티를 반환합니다.
str_to_map(expr[,pairDelim[,keyValueDelim]]) 구분 기호를 사용하여 expr을 키-값 쌍으로 분할한 후 맵을 반환합니다.
transform_keys(expr, func) expr 함수를 사용하여 func의 맵에 있는 키를 변환합니다.
transform_values(expr, func) 함수 func를 사용하여 values을/를 expr 맵으로 변환합니다.
try_element_at(mapExpr, key) mapExprkey 값 또는 NULL(key가 존재하지 않는 경우)을 반환합니다.

날짜, 타임스탬프 및 간격 함수

날짜 및 타임스탬프 형식에 대한 자세한 내용은 날짜/시간 패턴을 참조하세요.

함수 설명
intervalExpr / divisor 간격을 divisor로 나눈 값을 반환합니다.
- intervalExpr intervalExpr의 부정 값을 반환합니다.
intervalExpr1 - intervalExpr2 intervalExpr2에서 intervalExpr1를 뺀 값을 반환합니다.
datetimeExpr1 - datetimeExpr2 datetimeExpr2에서 datetimeExpr1를 뺀 값을 반환합니다.
+ intervalExpr intervalExpr의 값을 반환합니다.
intervalExpr1 + intervalExpr2 intervalExpr1intervalExpr2의 합계를 반환합니다.
intervalExpr * multiplicand intervalExprmultiplicand를 곱한 값을 반환합니다.
abs(expr) expr의 간격 값에 대한 절댓값을 반환합니다.
add_months(startDate,numMonths) numMonths 이후의 startDate 날짜를 반환합니다.
curdate() 쿼리 평가 시작 시 현재 날짜를 반환합니다.
current_date() 쿼리 평가 시작 시 현재 날짜를 반환합니다.
current_timestamp() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
current_timezone() 현재 세션의 로컬 timezone를 반환합니다.
date(expr) expr 값을 DATE로 캐스팅합니다.
date_add(startDate,numDays) numDays 이후의 날짜 startDate를 반환합니다.
date_add(unit, value, expr) 타임스탬프 valueunitexpr를 추가합니다.
date_diff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
date_format(expr,fmt) 타임스탬프를 fmt형식의 문자열로 변환합니다.
date_from_unix_date(days) 1970-01-01 이후의 일 수에서 날짜를 만듭니다.
date_part(field,expr) 날짜, 타임스탬프 또는 간격의 일부를 추출합니다.
date_sub(startDate,numDays) numDays 이전의 날짜 startDate를 반환합니다.
date_trunc(unit,expr) unit에 지정된 단위로 잘린 타임스탬프를 반환합니다.
dateadd(startDate,numDays) numDays 이후의 날짜 startDate를 반환합니다.
dateadd(unit, value, expr) 타임스탬프 valueunitexpr를 추가합니다.
datediff(endDate,startDate) startDate에서 endDate까지의 일 수를 반환합니다.
datediff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
day(expr) 날짜 또는 타임스탬프의 날짜를 반환합니다.
dayname(expr) 지정된 날짜의 요일에 대한 세 글자 영어 약어를 반환합니다.
dayofmonth(expr) 날짜 또는 타임스탬프의 날짜를 반환합니다.
dayofweek(expr) 날짜 또는 타임스탬프의 요일을 반환합니다.
dayofyear(expr) 날짜 또는 타임스탬프의 연간 일자를 반환합니다.
divisor div dividend divisor 간격을 dividend 간격으로 나눈 값의 정수 부분을 반환합니다.
extract(field FROM source) fieldsource를 반환합니다.
from_unixtime(unixTime,fmt) unixTimefmt을 반환합니다.
from_utc_timestamp(expr,timezone) 타임스탬프의 UTC 타임스탬프를 exprtimeZone반환합니다.
getdate() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
hour(expr) 타임스탬프의 시간 구성 요소를 반환합니다.
last_day(expr) 날짜가 속한 월의 마지막 날짜를 반환합니다.
make_date(year,month,day) year, month, day 필드에서 날짜를 만듭니다.
make_dt_interval([days[, hours[, mins[, secs]]]]) days, hours, minssecs에서 일-시간 간격을 만듭니다.
make_interval(years, months, weeks, days, hours, mins, secs) 사용되지 않음: years, months, weeks, days, hours, minssecs에서 간격을 만듭니다.
make_timestamp(year,month,day,hour,min,sec[,timezone]) year, month, day, hour, min, sectimezone 필드에서 타임스탬프를 만듭니다.
make_ym_interval([years[, months]]) yearsmonths에서 연-월 간격을 만듭니다.
minute(expr) expr에 있는 타임스탬프의 분 구성 요소를 반환합니다.
month(expr) expr에 있는 타임스탬프의 월 구성 요소를 반환합니다.
months_between(expr1,expr2[,roundOff]) expr1expr2에 있는 날짜 또는 타임스탬프 사이에서 경과된 월 수를 반환합니다.
next_day(expr,dayOfWeek) expr보다 나중이고 이름이 dayOfWeek인 첫 번째 날짜를 반환합니다.
now() 쿼리 평가 시작 시의 현재 타임스탬프를 반환합니다.
quarter(expr) 1에서 4 범위에서 expr의 연도 분기를 반환합니다.
second(expr) expr에 있는 타임스탬프의 초 구성 요소를 반환합니다.
session_window(expr, gpDuration) 타임스탬프 표현식을 통해 세션window을 만듭니다.
sign(expr) expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다.
signum(expr) expr 간격이 음수, 0 또는 양수일 때 -1.0, 0.0 또는 1.0을 반환합니다.
timediff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
timestamp(expr) expr에서 TIMESTAMP로 캐스트.
timestamp_micros(expr) UTC Epoch 이후 타임스탬프 expr 마이크로초를 만듭니다.
timestamp_millis(expr) UTC epoch 이후 타임스탬프 expr밀리초를 만듭니다.
timestamp_seconds(expr) UTC epoch 이후 타임스탬프 expr 초를 만듭니다.
timestampadd(unit, value, expr) 타임스탬프 valueunitexpr를 추가합니다.
timestampdiff(unit, start, stop) unit 단위로 측정된 두 타임스탬프의 차이를 반환합니다.
to_date(expr[,fmt]) 선택적 서식을 사용한 날짜로 캐스팅된 expr을 반환합니다.
to_timestamp(expr[,fmt]) 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr을 반환합니다.
to_unix_timestamp(expr[,fmt]) expr의 타임스탬프를 UNIX 타임스탬프로 반환합니다.
to_utc_timestamp(expr,timezone) 타임스탬프의 UTC 타임스탬프를 exprtimezone반환합니다.
trunc(expr, fmt) 날짜의 일부가 형식 모델 fmt에 의해 지정된 단위로 잘린 날짜를 반환합니다.
try_add(expr1, expr2) expr1expr2의 합계를 반환하며 오류 발생 시 NULL을 반환합니다.
try_divide(dividend, divisor) dividenddivisor로 나눈 값을 반환하거나 divisor가 0이면 NULL을 반환합니다.
try_multiply(multiplier, multiplicand) multipliermultiplicand의 곱 또는 오버플로의 NULL을 반환합니다.
try_subtract(expr1, expr2) expr2에서 expr1를 뺀 값이나, 오버플로에 대해 NULL을 반환합니다.
try_to_timestamp(expr[,fmt]) 선택적 형식을 사용하여 타임스탬프로 캐스팅된 expr을 반환하거나 캐스팅이 실패하면 NULL을 반환합니다.
unix_date(expr) 1970-01-01 이후의 일 수를 반환합니다.
unix_micros(expr) 1970-01-01 00:00:00 UTC 이후 경과된 마이크로초 수를 반환합니다.
unix_millis(expr) 1970-01-01 00:00:00 UTC 이후 경과된 밀리초 수를 반환합니다.
unix_seconds(expr) 1970-01-01 00:00:00 UTC 이후 경과된 초 수를 반환합니다.
unix_timestamp([expr[, fmt]]) 현재 또는 지정된 시간의 UNIX 타임스탬프를 반환합니다.
weekday(expr) expr의 요일을 반환합니다.
weekofyear(expr) expr 연도의 주를 반환합니다.
year(expr) expr의 연도 구성 요소를 반환합니다.
window(expr, width[, step[, start]]) 타임스탬프 식에 대한 호핑 기반 슬라이딩window 만듭니다.
window_time(window) window 또는 session_window 함수로 생성된 슬라이딩window의 포함된 종료 시간을 반환합니다.

H3 지리 공간적 함수

H3 지리 공간적 함수에 대한 자세한 내용은 H3 지리 공간적 함수를 참조하세요.

캐스트 함수 및 생성자

형식 간 캐스팅에 대한 자세한 내용은 캐스트 함수try_cast 함수를 참조하세요.

함수 설명
array([expr [, …]]) expr의 요소가 있는 배열을 반환합니다.
bigint(expr) exprBIGINT로 캐스팅합니다.
binary(expr) expr의 값을 BINARY로 캐스팅합니다.
boolean(expr) expr에서 BOOLEAN로 캐스트.
cast(expr AS type) expr을 대상 데이터 형식 type으로 캐스트합니다.
expr :: type expr을 대상 데이터 형식 type으로 캐스트합니다.
date(expr) exprDATE로 캐스팅합니다.
decimal(expr) exprDECIMAL로 캐스팅합니다.
double(expr) exprDOUBLE로 캐스팅합니다.
float(expr) exprFLOAT로 캐스팅합니다.
int(expr) exprINTEGER로 캐스팅합니다.
make_date(year,month,day) year, month, day 필드에서 날짜를 만듭니다.
make_dt_interval([days[, hours[, mins[, secs]]]]) days, hours, minssecs에서 일-시간 간격을 만듭니다.
make_interval(years, months, weeks, days, hours, mins, secs) years, months, weeks, days, hours, minssecs에서 간격을 만듭니다.
make_timestamp(year,month,day,hour,min,sec[,timezone]) year, month, day, hour, min, sectimezone 필드에서 타임스탬프를 만듭니다.
make_ym_interval([years[, months]]) yearsmonths에서 연-월 간격을 만듭니다.
map([{key1, value1} [, …]]) 지정된 키-값 쌍을 사용하여 맵을 만듭니다.
named_struct({name1, val1} [, …]) 지정된 필드 이름과 values사용하여 구조체를 만듭니다.
smallint(expr) exprSMALLINT로 캐스팅합니다.
string(expr) exprSTRING로 캐스팅합니다.
struct(expr1 [, …]) 지정된 필드 values을 사용하여 STRUCT을 만듭니다.
tinyint(expr) expr에서 TINYINT로 캐스트.
timestamp(expr) expr에서 TIMESTAMP로 캐스트.
to_char(expr, fmt) expr 형식을 사용하여 STRINGfmt로 반환합니다.”
to_date(expr[,fmt]) 선택적 서식을 사용한 날짜로 캐스팅된 expr을 반환합니다.
to_number(expr, fmt) expr 형식을 사용하여 DECIMAfmtL로 반환합니다.
to_timestamp(expr[,fmt]) 선택적 형식 지정을 사용하여 타임스탬프로 캐스팅된 expr을 반환합니다.
to_varchar(expr, fmt) expr 형식을 사용하여 STRINGfmt로 반환합니다.”
try_cast(expr AS type) expr 값을 type 대상 데이터 형식으로 안전하게 캐스팅합니다.
try_to_number(expr, fmt) 형식 expr를 사용하여 DECIMALfmt로 형변환하거나, NULL가 유효하지 않은 경우 expr로 반환합니다.

CSV 및 Avro 함수

함수 설명
from_avro(avroBin, jsonSchema[, options]) 및 에 따라 avroBin 구조체 값을 반환합니다 jsonSchema.
from_csv(csvStr, schema[, 옵션]) csvStrschema가 있는 구조체 값을 반환합니다.
schema_of_csv(csv[, options]) CSV 문자열의 schema을 DDL 형식으로 반환합니다.
to_avro(expr[, options]) 지정된 구조체 값을 사용하여 Avro 이진 값을 반환합니다.
to_csv(expr[, options]) 지정된 구조체 값이 있는 CSV 문자열을 반환합니다.

JSON 함수

함수 설명
jsonStr : jsonPath jsonStr에서 추출된 필드를 반환합니다.
from_json(jsonStr, schema[, 옵션]) jsonStrschema가 있는 구조체 값을 반환합니다.
get_json_object(expr, path) JSON에서 path 개체를 추출합니다.
json_array_length(jsonArray) 가장 바깥쪽 JSON 배열의 요소 수를 반환합니다.
json_object_keys(jsonObject) 가장 바깥쪽 JSON 개체의 모든 키를 배열로 반환합니다.
json_tuple(jsonStr, path1 [, …]) 여러 JSON 개체를 튜플로 반환합니다.
parse_json(jsonStr) VARIANT에서 jsonStr 값을 반환합니다.
schema_of_json(jsonStr[, options]) JSON 문자열의 schema을 DDL 형식으로 반환합니다.
schema_of_json_agg(jsonStr[, options]) 그룹 JSON 문자열의 결합된 schema DDL 형식으로 반환합니다.
to_json(expr[, options]) STRUCT에 지정된 VARIANT 또는 expr가 포함된 JSON 문자열을 반환합니다.

VARIANT 함수

함수 설명
variantExpr : jsonPath JSON 경로를 사용하여 variantExpr에서 추출한 필드를 반환합니다.
is_variant_null(variantExpr) 테스트 variantExprVARIANT로 인코딩된 NULL인지 여부를 확인합니다.
parse_json(jsonStr) VARIANT에서 jsonStr 값을 반환합니다.
schema_of_variant(variantExpr) VARIANT 식의 schema을 DDL 형식으로 반환합니다.
schema_of_variant_agg(variantExpr) 모든 VARIANTvalues의 결합된 schema를 DDL 형식으로 반환합니다.
to_json(expr[, options]) STRUCT에 지정된 VARIANT 또는 expr가 포함된 JSON 문자열을 반환합니다.
try_parse_json(jsonStr) VARIANT가 가능한 경우 jsonStr 값을 반환합니다. NULL가 가능 하지 않은 경우 반환됩니다.
try_variant_get(variantExpr,path,type) 대상 형식으로 형변환할 수 없는 경우 type 또는 variantExpr로 지정된 path에서 NULL 형식의 값을 추출합니다.
variant_explode(입력) input중첩을 해제하여 set 개의 행을 반환합니다.
variant_explode_outer(입력) 외부 의미론을 사용하여 input을 중첩 해제하여 set개의 행을 반환합니다.
variant_get(variantExpr,path,type) type가 지정한 variantExpr에서 path 유형의 값을 추출합니다.

XPath 및 XML 함수

함수 설명
from_xml(xmlStr, schema[, 옵션]) xmlStr를 사용하여 schema에서 구문 분석된 구조체 값을 반환합니다.
schema_of_xml(xmlStr[, options]) DDL 형식으로 XML 문자열의 schema을 반환합니다.
xpath(xml, xpath) xml 노드 내에서 xpath와 일치하는 values을 반환합니다.
xpath_boolean(xml, xpath) true 식이 xpath로 평가되거나 true에서 일치하는 노드가 있으면 xml를 반환합니다.
xpath_double(xml, xpath) XML 문서에서 DOUBLE값을 반환합니다.
xpath_float(xml, xpath) XML 문서에서 FLOAT값을 반환합니다.
xpath_int(xml, xpath) XML 문서에서 INTEGER값을 반환합니다.
xpath_long(xml, xpath) XML 문서에서 BIGINT값을 반환합니다.
xpath_number(xml, xpath) XML 문서에서 DOUBLE값을 반환합니다.
xpath_short(xml, xpath) XML 문서에서 SHORT값을 반환합니다.
xpath_string(xml, xpath) XPath 식과 일치하는 첫 번째 XML 노드의 콘텐츠를 반환합니다.

AI 함수

함수 설명
ai_analyze_sentiment(content) 텍스트의 감정을 반환합니다.
ai_classify(content, labels) 제공된 콘텐츠를 제공된 레이블 중 하나로 분류합니다.
ai_extract(content, labels) 지정된 텍스트에서 레이블로 지정된 엔터티를 추출합니다.
ai_fix_grammar(content) 지정된 텍스트의 문법 오류를 수정합니다.
ai_forecast(observed, time_col) 시계열 데이터를 미래로 내세울 수 있습니다.
ai_gen(content) Databricks Foundation 모델 API에서 최첨단 생성 AI 모델을 호출하여 사용자가 제공한 프롬프트에 응답합니다.
ai_generate_text(prompt, modelName[, param1, value1] [...]) 사용되지 않음: 프롬프트가 지정된 경우 선택한 LLM(큰 언어 모델)에서 생성된 텍스트를 반환합니다.
ai_mask(콘텐츠, 레이블) 지정된 텍스트 내에서 지정된 엔터티를 마스크합니다.
ai_query(endpointName, request, returnType) 엔드포인트를 제공하는 기존 Mosaic AI 모델을 호출하고 해당 응답을 구문 분석하고 반환합니다.
ai_similarity(strExpr1, strExpr2) 두 문자열을 비교하고 의미 체계 유사성 점수를 계산합니다.
ai_summarize(content[, max_words]) 지정된 텍스트의 요약을 생성합니다.
ai_translate(콘텐츠, to_lang) 텍스트를 지정된 대상 언어로 변환합니다.
vector_search(인덱스, 쿼리, num_results) SQL을 사용하여 Mosaic AI Vector Search 인덱스 쿼리

Read 함수

함수 설명
read_files(path, [optionKey => optionValue] [, ...]) 클라우드 스토리지에서 데이터 파일을 읽고 테이블 형식으로 반환합니다.
read_kafka([optionKey => optionValue] [, ...]) Apache Kafka 클러스터에서 레코드를 읽고 테이블 형식으로 반환합니다.
read_kinesis({parameter => value} [, ...]) 하나 이상의 스트림에서 Kinesis 에서 읽은 레코드를 포함한 table을 반환합니다.
read_pubsub([parameter => value] [, ...]) Pub/Sub의 특정 주제에서 레코드를 읽기 위한 table 값을 가진 함수입니다.
read_pulsar({optionKey => optionValue} [, ...]) table을 반환하여 Pulsar에서 읽은 레코드를 제공합니다.
read_state_metadata(path) 스트리밍 쿼리 상태의 메타데이터를 나타내는 행을 포함하는 table를 반환합니다.
read_statestore(path [, option_key => option_value] [...]) 스트리밍 쿼리의 상태 저장소에서 레코드를 반환합니다.

기타 함수

함수 설명
assert_true(expr) expr이 true가 아니면 오류를 반환합니다.
CASE expr { WHEN opt1 THEN res1 } […] [ELSE def] END resN과 같은 첫 번째 optN에 대해 expr을 반환하거나 일치하는 항목이 없으면 def를 반환합니다.
CASE { WHEN cond1 THEN res1 } […] [ELSE def] END true로 평가되는 첫 번째 resN에 대한 condN을 반환하거나 해당 항목이 없으면 def를 반환합니다.
cloud_files_state( { TABLE(table) | checkpoint } ) 자동 로더 cloud_files 원본의 파일 수준 상태를 반환합니다.
coalesce(expr1, expr2 [, …]) Null이 아닌 첫 번째 인수를 반환합니다.
데이터 정렬() 사용 가능한 데이터 정렬의 list 반환합니다.
cube (expr1 [, …]) 지정된 식 columns사용하여 다차원 큐브를 만듭니다.
current_catalog() 현재 catalog값을 반환합니다.
current_database() 현재 schema값을 반환합니다.
current_metastore() 현재 Unity Catalog Metastore ID를 반환합니다.
current_recipient(키) Delta 공유와 공유된 보기에서 현재 받는 사람의 속성을 반환합니다.
current_schema() schema의 현재 값을 반환합니다.
current_user() 문을 실행하는 사용자를 반환합니다.
current_version() 현재 버전의 Azure Databricks를 반환합니다.
decode(expr, { key, value } [, …] [,defValue]) 키와 일치하는 값을 반환합니다.
elt(index, expr1 [, …] ) nth 식을 반환합니다.
equal_null(expr1, expr2) trueexpr1와 같거나 두 식이 모두 expr2이면 NULL를 반환합니다. 그렇지 않으면 false를 반환합니다.
event_log( { TABLE(table) | pipeline_id } ) 구체화된 뷰, 스트리밍 table또는 DLT 파이프라인에 대한 refresh 기록의 table을(를) 반환한다.
greatest(expr1, expr2 [, …]) null values건너뛰고 모든 인수의 가장 큰 값을 반환합니다.
grouping(col) 지정된 column이 GROUPING SET, ROLLUP또는 CUBE의 부분합을 나타내는지 여부를 나타냅니다.
grouping_id([col1 [, …]]) set의 columns에 대한 그룹화 수준을 반환합니다.
hash(expr1 [, …]) 인수의 해시 값을 반환합니다.
hll_sketch_estimate(expr) HyperLogLog 스케치에서 수집된 고유 values의 개수를 추정합니다.
hll_union(expr1, expr2 [,allowDifferentLgConfigK]) 두 개의 HyperLogLog 스케치를 결합합니다.
java_method(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출합니다.
if(cond, expr1, expr2) expr1cond인 경우 true를 반환하거나 그렇지 않으면 expr2을 반환합니다.
iff(cond, expr1, expr2) expr1cond인 경우 true를 반환하거나 그렇지 않으면 expr2을 반환합니다.
ifnull(expr1, expr2) expr2expr1인 경우 NULL를 반환하거나 그렇지 않으면 expr1을 반환합니다.
input_file_block_length() 읽는 블록의 길이(바이트)를 반환합니다.
input_file_block_start() 읽는 블록의 시작 offset 바이트 단위로 반환합니다.
input_file_name() 읽고 있는 파일의 이름을 반환하거나, 사용할 수 없는 경우 빈 문자열을 반환합니다.
is_account_group_member(group) 현재 사용자가 계정 수준에서 그룹의 멤버인 경우 true를 반환합니다.
is_member(group) 현재 사용자가 작업 영역 수준에서 그룹의 멤버인 경우 true를 반환합니다.
isnull(expr) trueexpr이면 NULL를 반환합니다.
isnotnull(expr) trueexpr이 아니면 NULL를 반환합니다.
least(expr1, expr2 [, …]) null values건너뛰고 모든 인수의 가장 작은 값을 반환합니다.
list_secrets([scopeStr]) 사용자가 Databricks 비밀 서비스에서 볼 수 있는 권한이 있는 전체 또는 하나의 범위의 키를 반환합니다.
luhn_check(numStr) truenumStr 검사를 통과하면 를 반환합니다.
monotonically_increasing_id() 단조롭게 증가하는 64비트 정수를 반환합니다.
nullif(expr1, expr2) NULLexpr1와 같으면 expr2을 반환하고, 그렇지 않으면 expr1을 반환합니다.
nvl(expr1, expr2) expr2expr1인 경우 NULL를 반환하거나 그렇지 않으면 expr1을 반환합니다.
nvl2(expr1, expr2, expr3) expr2expr1이 아닌 경우 NULL를 반환하거나 그렇지 않으면 expr3을 반환합니다.
raise_error(expr) expr을 메시지로 사용하여 예외를 throw합니다.
range(end) 지정된 범위 내에서 table을(를) values로 반환합니다.
range(start, end [, step [, numParts]]) 지정된 범위 내의 table의 values을 반환합니다.
reflect(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출합니다.
secret(scope, key) scope에서 지정된 key로 비밀 값을 추출합니다.
session_user() Azure Databricks에 연결된 사용자를 반환합니다.
spark_partition_id() 현재 partition ID를 반환합니다.
sql_keywords() 이 함수는 Azure Databricks에서 SQL 키워드의 set을 반환합니다.
stack(numRows, expr1 [, …]) expr1, …, exprNnumRows개 행으로 구분합니다.
table_changes(table_str, start [, end]) 변경 데이터 피드가 사용되도록 설정된 Delta Lake table의 변경 로그를 반환합니다.
try_reflect(class, method[, arg1 [, …]]) 리플렉션을 사용하여 메서드를 호출하고 NULL 메서드가 실패하면 반환합니다.
try_secret(scope, key) scope에서 주어진 key를 사용하여 비밀 값을 추출하거나 키를 검색할 수 없는 경우 NULL를 추출합니다.
typeof(expr) expr 데이터 형식에 대한 DDL 형식 문자열을 반환합니다.
user() 문을 실행하는 사용자를 반환합니다.
uuid() UUID(범용 고유 identifier) 문자열을 반환합니다.
window(expr, 폭[, 단계 [, 시작]]) 타임스탬프 식을 기반으로 한 호핑 방식의 슬라이딩window을 만듭니다.
xxhash64(expr1 [, …]) 인수의 64비트 해시 값을 반환합니다.
version() Apache Spark 버전을 반환합니다.