Partager via


Fonction validate_utf8

S’applique à : coche marquée oui Databricks Runtime 15.4 et versions ultérieures

Retourne la valeur d’entrée si elle correspond à une chaîne UTF-8 valide, ou lève INVALID_UTF8_STRING sinon.

Syntaxe

validate_utf8(strExpr)

Arguments

  • strExpr : expression STRING.

Retours

Un STRING correspondant octet par octet à strExpr au cas où il représente une chaîne UTF-8 valide, lève INVALID_UTF8_STRING sinon.

Pour retourner NULL si l’entrée n’est pas une chaîne UTF-8 valide, utilisez la fonction try_validate_utf8.

Exemples

– Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

– Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

– Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

– Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  [INVALID_UTF8_STRING] Invalid UTF8 byte sequence found in string: \x80.