Compartir a través de


Función validate_utf8

Se aplica a: casilla marcada como Sí Databricks Runtime 15.4 y versiones posteriores

Devuelve el valor de entrada si corresponde a una cadena UTF-8 válida o INVALID_UTF8_STRING.

Sintaxis

validate_utf8(strExpr)

Argumentos

  • strExpr: expresión STRING.

Devoluciones

Un STRING de tipo byte igual a strExpr en caso de que represente una cadena UTF-8 válida o INVALID_UTF8_STRING.

Para devolver NULL si la entrada no es una cadena UTF-8 válida, use la función try_validate_utf8.

Ejemplos

– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  [INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.