Функция encode
Область применения: Databricks SQL Databricks Runtime
Возвращает двоичное представление строки с использованием кодировки символов charSet
.
Синтаксис
encode(expr, charSet)
Аргументы
-
expr
STRING
: выражение, закодированное. -
charSet
STRING
: выражение, указывающее кодировку.
Возвраты
BINARY
.
Поддерживаются следующие типы кодировки set (без учета регистра):
-
'US-ASCII'
: семи-разрядный ASCII, ISO646-US. -
'ISO-8859-1'
: латинский алфавит ISO No 1, ISO-LATIN-1. -
'UTF-8'
: восьмибитовый формат преобразования UCS. -
'UTF-16BE'
: шестнадцати-разрядный формат преобразования UCS, порядок байтов больших байтов. -
'UTF-16LE'
: шестнадцати-разрядный формат преобразования UCS, маленький порядок байтов. -
'UTF-16'
: шестнадцателетний формат преобразования UCS, порядок байтов, определенный необязательным знаком порядка байтов.
Примеры
-- Wrap encode in hex to normalize UI dependent BINARY output.
> SELECT hex(encode('Spark SQL', 'UTF-16'));
FEFF0053007000610072006B002000530051004C
> SELECT hex(encode('Spark SQL', 'US-ASCII'));
537061726B2053514C
> SELECT decode(X'FEFF0053007000610072006B002000530051004C', 'UTF-16')
Spark SQL