다음을 통해 공유


make_valid_utf8 기능

적용 대상: 예로 표시된 확인 Databricks Runtime 15.4 이상

잘못된 UTF-8 바이트 시퀀스가 strExpr모두 유니코드 대체 문자(U+FFFD)로 대체되는 문자열을 반환합니다.

구문

make_valid_utf8(strExpr)

인수

  • strExpr: STRING 식입니다.

반품

유효한 UTF-8 바이트 시퀀스로 구성된 A STRING입니다.

예제

– Simple example taking a valid string as input.
> SELECT make_valid_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT make_valid_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT make_valid_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT make_valid_utf8(x'80')
  �

- Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT make_valid_utf8(x'61C262')
  a�b