Поделиться через


Функция validate_utf8

Область применения: флажок Databricks Runtime 15.4 и более поздних версий

Возвращает входное значение, если оно соответствует допустимой строке UTF-8 или вызывается INVALID_UTF8_STRING в противном случае.

Синтаксис

validate_utf8(strExpr)

Аргументы

  • strExpr: Выражение STRING.

Возвраты

Значение STRING , равное байтам, равное strExpr допустимой строке UTF-8 или вызывается INVALID_UTF8_STRING в противном случае.

Чтобы вернуть NULL , если входные данные не являются допустимой строкой UTF-8, используйте функцию try_validate_utf8 .

Примеры

– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  [INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.