Поделиться через


Функция to_avro

применимо:отмечено да Databricks Runtime 16.0 и более поздние версии

Возвращает двоичное значение Avro с указанным входным значением.

Синтаксис

to_avro(expr [, avroSchemaSpec] )

Аргументы

  • expr: выражение.
  • avroSchemaSpec: необязательный объект schema в формате JSON. Если он указан, он должен соответствовать типу, указанному expr в заметках.

Возвраты

В кодировке BINARYAvro.

Примечания.

Сопоставление типов SQL с типами Avro выглядит следующим образом:

Тип SQL Avro schema
VOID { "type" : "null" }
BOOLEAN { "type" : "boolean" }
TINYINT { "type" : "int" }
SMALLINT { "type" : "int" }
INT { "type" : "int" }
BIGINT { "type" : "long" }
DECIMAL(p, s) { "type": "fixed", "name": "a", logicalType": "decimal", "size": (p+1)/2, precision": p, "scale": s }
FLOAT { "type" : "float" }
DOUBLE { "type" : "float" }
STRING { "type" : "string" }
DATE { "type" : "int", "logicalType" : "date" }
TIMESTAMP { "type" : "long" } как микросекунда с тех пор 1970-01-01 00:00:00.000000
TIMESTAMP_NTZ { "type" : "long" } как микросекунда с тех пор 1970-01-01 00:00:00.000000
YEAR MONTH INTERVAL { "type" : "long" } как месяцы
DAY TIME INTERVAL { "type" : "long" } как микросекунды
BINARY { "type" : "bytes" }
STRUCT<field1 type1, ...> { "type" : "record", "name": "struct_name", "fields": [ { "name" : "field1", "type" : ... }, ... ] }
ARRAY<type> { "type" : "array", "items": { "type" : ... }
MAP<STRING, valueType> { "type" : "map", "keyType": { "type" : ... }, "valueType": { "type" : ... } }
MAP<nonStringType, valueType> Не поддерживается
VARIANT Не поддерживается

Примеры

> SELECT from_avro(to_avro(5), '{ "type" : "int" }');
  5

> SELECT from_avro(to_avro(5, '{ "type" : "int" }'), '{ "type" : "int" }');
  5

> SELECT from_avro(to_avro(named_struct('num', 5, 'txt', 'hello')), '{ "type" : "record", "name": "my_record", "fields": [{ "name": "num", "type": "int"}, { "name": "txt", "type": "string"}]}');
  {"num":5,"txt":"hello"}