Funkce validate_utf8
Platí pro: Databricks Runtime 15.4 a novější
Vrátí vstupní hodnotu, pokud odpovídá platnému řetězci UTF-8 nebo vyvolá INVALID_UTF8_STRING
jinak.
Syntaxe
validate_utf8(strExpr)
Argumenty
strExpr
: VýrazSTRING
.
Návraty
Jedná se o STRING
bajtový řetězec, který se rovná strExpr
v případě, že představuje platný řetězec UTF-8 nebo jinak vyvolá INVALID_UTF8_STRING
.
Pokud chcete vrátit NULL
, pokud vstup není platným řetězcem UTF-8, použijte funkci try_validate_utf8 .
Příklady
– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
Spark
– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
SQL
– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
a
– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
[INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.