validate_utf8
函数
适用于: Databricks Runtime 15.4 及更高版本
如果输入值对应于有效的 UTF-8 字符串,则返回该值,否则引发 INVALID_UTF8_STRING
。
语法
validate_utf8(strExpr)
参数
strExpr
:一个STRING
表达式。
返回
STRING
,如果表示有效的 UTF-8 字符串,则字节数等于 strExpr
,否则引发 INVALID_UTF8_STRING
。
如果输入不是有效的 UTF-8 字符串,要返回 NULL
,请使用 try_validate_utf8 函数。
示例
– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
Spark
– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
SQL
– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
a
– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
[INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.