Delen via


validate_utf8-functie

Van toepassing op: vinkje als ja aan Databricks Runtime 15.4 en hoger

Retourneert de invoerwaarde als deze overeenkomt met een geldige UTF-8-tekenreeks of anders wordt gegenereerd INVALID_UTF8_STRING .

Syntaxis

validate_utf8(strExpr)

Argumenten

  • strExpr: Een STRING expressie.

Retouren

Een STRING tekenreeks die bytegewijs gelijk is aan strExpr voor het geval deze een geldige UTF-8-tekenreeks vertegenwoordigt INVALID_UTF8_STRING of anders omhoog gaat.

Als u wilt retourneren NULL als de invoer geen geldige UTF-8-tekenreeks is, gebruikt u de functie try_validate_utf8 .

Voorbeelden

– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  [INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.