다음을 통해 공유


validate_utf8 기능

적용 대상: 예로 표시된 확인 Databricks Runtime 15.4 이상

유효한 UTF-8 문자열에 해당하거나 그렇지 않은 경우 입력 값을 반환합니다 INVALID_UTF8_STRING .

구문

validate_utf8(strExpr)

인수

  • strExpr: STRING 식입니다.

반품

STRING 유효한 UTF-8 문자열을 strExpr 나타내거나 그렇지 않은 경우 바이트 단위로 발생합니다INVALID_UTF8_STRING.

입력이 유효한 UTF-8 문자열이 아닌 경우 반환 NULL 하려면 try_validate_utf8 함수를 사용합니다.

예제

– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  [INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.