validate_utf8
-Funktion
Gilt für: Databricks Runtime 15.4 und höher
Gibt den Eingabewert zurück, wenn er einer gültigen UTF-8-Zeichenkette entspricht oder gibt andernfalls INVALID_UTF8_STRING
aus.
Syntax
validate_utf8(strExpr)
Argumente
strExpr
: EinSTRING
-Ausdruck.
Gibt zurück
Ein STRING
, der byteweise gleich strExpr
ist, wenn es eine gültige UTF-8-Zeichenkette darstellt, oder gibt andernfalls INVALID_UTF8_STRING
aus.
Um NULL
zurückzugeben, wenn die Eingabe kein gültiger UTF-8-String ist, verwenden Sie die Funktion try_validate_utf8.
Beispiele
– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
Spark
– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
SQL
– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
a
– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
[INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.