Функции преобразования в потоке данных для сопоставления
ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure
Azure Synapse Analytics
Совет
Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !
Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.
В следующих статьях приведены сведения о функциях и выражениях, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.
Список функций преобразования
Функции преобразования используются для преобразования данных и проверки типов данных.
Функция преобразования | Задача |
---|---|
ascii | Возвращает числовое значение входного символа. Если входная строка имеет несколько символов, возвращается числовое значение первого символа. |
char | Возвращает символ ascii, представленный входным номером. Если число больше 256, результат эквивалентен char(число % 256) |
расшифровывать | Декодирует закодированные входные данные в строку на основе заданного набора символов. Второй (необязательный) аргумент можно использовать для указания используемого набора символов : US-ASCII, ISO-8859-1, UTF-8 (по умолчанию), UTF-16BE, UTF-16LE, UTF-16LE, UTF-16. |
кодировать | Кодирует входные строковые данные в двоичный файл на основе charset. Второй (необязательный) аргумент можно использовать для указания используемого набора символов : US-ASCII, ISO-8859-1, UTF-8 (по умолчанию), UTF-16BE, UTF-16LE, UTF-16LE, UTF-16. |
isBitSet | Проверяет, задана ли битовая позиция в этом битовом наборе |
setBitSet | Задает битовые позиции в этом битовом наборе |
isBoolean | Проверяет, является ли строковое значение логическим значением в соответствии с правилами toBoolean() . |
isByte | Проверяет, является ли строковое значение байтовым значением, заданным с использованием необязательного формата в соответствии с правилами toByte() . |
isDate | Проверяет, является ли входная строка даты датой, используя необязательный формат входной даты. Доступные форматы приведены в описании SimpleDateFormat в Java. Если формат входной даты не указан, формат по умолчанию — yyyy-[M]M-[d]d . Допустимые форматы: [ yyyy, yyyy-[M]M, yyyy-[M]M-[d]d, yyyy-[M]M-[d]dT* ] |
isShort | Проверяет, является ли строковое значение коротким, заданным с использованием необязательного формата в соответствии с правилами toShort() |
isInteger | Проверяет, является ли строковое значение целым числом, заданным с использованием необязательного формата в соответствии с правилами toInteger() . |
isLong | Проверяет, является ли строковое значение числом long, заданным с использованием необязательного формата в соответствии с правилами toLong() . |
isNan | Проверяет, не является ли значение числом. |
isFloat | Проверяет, является ли строковое значение числом с плавающей точкой, заданным с использованием необязательного формата в соответствии с правилами toFloat() . |
isDouble | Проверяет, является ли строковое значение значением double, заданным с использованием необязательного формата в соответствии с правилами toDouble() . |
isDecimal | Проверяет, является ли строковое значение десятичным значением, заданным с использованием необязательного формата в соответствии с правилами toDecimal() |
isTimestamp | Проверяет, является ли входная строка даты меткой времени с использованием необязательного формата входной метки времени. Доступные форматы приведены в описании SimpleDateFormat в Java. Если метка времени опущена, используется формат по умолчанию: yyyy-[M]M-[d]d hh:mm:ss[.f...] . Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". Метка времени поддерживает точность до миллисекунд и значение до 999. Доступные форматы приведены в описании SimpleDateFormat в Java. |
toBase64 | Кодирует указанную строку в формат Base64. |
toBinary | Преобразовывает все числовые значения, дату, метку времени, строку в двоичное представление. |
toBoolean | Преобразовывает значение ('t ", "true", "y" "yes","1") в значение true, ("f", "false", "n", "no","0") в false и значение NULL для любых других значений. |
toByte | Преобразовывает любое числовое или строковое значение в байтовое значение. Для преобразования может использоваться дополнительный десятичный формат Java. |
toDate | Преобразует строку даты ввода в дату, используя необязательный формат даты ввода. Доступные форматы приведены в описании класса Java SimpleDateFormat . Если формат даты ввода не указан, формат по умолчанию — гггг-[М]М-[д]д. Допустимые форматы: [ гггг, гггг-[М]М, гггг-[М]М-[д]д, гггг-[М]М-[д]д* ]. |
toDecimal | Преобразует любое числовое значение или строку в десятичное значение. Если точность и масштаб не указаны, по умолчанию используется значение (10,2). Для преобразования может использоваться дополнительный десятичный формат Java. Необязательный формат языкового стандарта в формате языка BCP47, например en-US, zh-CN. |
toDouble | Преобразует любое числовое значение или строку в двойное значение. Для преобразования может использоваться дополнительный десятичный формат Java. Необязательный формат языкового стандарта в формате языка BCP47, например en-US, zh-CN. |
toFloat | Преобразует любое числовое или строковое значение в плавающее. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение double. |
toInteger | Преобразует любое числовое или строковое значение в целое. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение long, float, double. |
toLong | Преобразует любое числовое или строковое значение в длинное. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение float, double. |
toShort | Преобразует любое числовое или строковое значение в короткое. Для преобразования может использоваться дополнительный десятичный формат Java. Усекает любое значение integer, long, float, double. |
toString | Преобразует примитивный тип данных в строку. Для чисел и даты можно указать формат. Если формат не задан, выбирается значение по умолчанию. Для чисел используется десятичный формат Java, Все возможные форматы даты приведены в описании SimpleDateFormat в Java; формат по умолчанию — гггг-ММ-дд. |
toTimestamp | Преобразует строку в метку времени на основе указанного формата метки времени (необязательно). Если метка времени опущена, используется формат по умолчанию: гггг-[М]М-[д]д чч:мм:сс[доля секунды]. Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". Метка времени поддерживает точность до миллисекунд и значение до 999. Доступные форматы приведены в описании класса Java SimpleDateFormat . https://docs.oracle.com/javase/8/docs/api/java/text/SimpleDateFormat.html. |
toUTC | Преобразует метку времени в формат UTC. Вы можете передать дополнительный часовой пояс в формате GMT, PST, UTC, "Острова Кайман". По умолчанию используется текущий часовой пояс. Доступные форматы приведены в описании класса Java SimpleDateFormat . https://docs.oracle.com/javase/8/docs/api/java/text/SimpleDateFormat.html. |
Связанный контент
- Список всех агрегатных функций.
- Список всех функций массивов.
- Список всех функций кэшированного поиска.
- Список всех функций даты и времени.
- Список всех функций выражений.
- Список всех функций сопоставления.
- Список всех метафункций.
- Список всех оконных функций.
- Сведения об использовании всех выражений преобразования данных.
- Создание выражений в потоке данных для сопоставления