Функции выражений в потоке данных для сопоставления
ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics
Совет
Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !
Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.
В следующих статьях приведены сведения о функциях выражений, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.
Список функций выражений
В Фабрике данных и конвейерах Synapse для настройки преобразований данных используйте язык выражений функции потока данных для сопоставления.
Функция выражения | Задача |
---|---|
abs | Абсолютное значение числа. |
acos | Вычисляет значение арккосинуса. |
добавление | Добавляет пару строк или чисел. Добавляет дату к числу дней. Добавляет длительность в метку времени. Добавляет один массив аналогичного типа к другому. Аналогично оператору +. |
and | Логический оператор И. Аналогично оператору &&. |
asin | Вычисляет значение арксинуса. |
assertErrorMessages | Возвращает сопоставление всех сообщений утверждения. |
atan | Вычисляет значение арктангенса. |
atan2 | Возвращает угол в радианах между положительной осью x плоскости и точкой, заданной координатами. |
between | Проверяет, находится ли первое значение между двумя другими значениями включительно. Можно сравнить числовые, строковые и значения даты и времени. |
bitwiseAnd | Побитовый оператор "И" для целочисленных типов. То же, что и оператор >. |
bitwiseOr | Побитовый оператор "ИЛИ" для целочисленных типов. Аналогично оператору |. |
bitwiseXor | Побитовый оператор "ИЛИ" для целочисленных типов. Аналогично оператору |. |
blake2b | Вычисляет хэш Blake2 набора столбцов различных примитивных типов данных с заданной разрядностью. Разрядность может быть только кратна 8 и должна быть в диапазоне от 8 до 512. Может использоваться для вычисления отпечатка строки. |
blake2bBinary | Вычисляет дайджест Blake2 набора столбцов различных примитивных типов данных с заданной битовой длиной, которая может быть несколько 8 от 8 до 512. Может использоваться для вычисления отпечатка строки. |
case | На основе чередующихся условий применяется одно или другое значение. Если входные числа четные, другим значением для последнего условия по умолчанию является NULL. |
cbrt | Вычисляет кубический корень числа. |
ceil | Возвращает наименьшее целое число, не меньшее заданного числа. |
coalesce | Возвращает из набора входных данных первое значение, не равное NULL. Все входные данные должны быть одного типа. |
columnNames | Получает имена всех выходных столбцов для потока. Можно передать необязательное имя потока в качестве первого аргумента и необязательный второй аргумент, чтобы возвращались только столбцы смещения схемы. |
columns | Получает значения всех выходных столбцов для потока. В качестве второго аргумента вы можете передать необязательное имя потока. |
compare | Сравнивает два значения одного типа. Возвращает отрицательное целое число, если значение1 < значение2, 0 — если значение1 == значение2, и положительное значение, если значение1 > значение2. |
concat | Объединяет переменное количество строк. Аналогично оператору + со строками. |
concatWS | Объединяет переменное количество строк с использованием разделителя. Первый параметр — это разделитель. |
cos | Вычисляет значение косинуса. |
cosh | Вычисляет значение гиперболического косинуса. |
crc32 | Вычисляет хэш-код CRC32 набора столбцов различных примитивных типов данных с заданной разрядностью. Разрядность должна иметь значение 0(256), 224, 256, 384 или 512. Может использоваться для вычисления отпечатка строки. |
degrees | Преобразует радианы в градусы. |
divide | Делит пару чисел. Аналогично оператору / . |
dropLeft | Удаляет столько же символов с левого конца строки. Если запрошенная операция удаления превышает длину строки, возвращается пустая строка. |
dropRight | Удаляет столько же символов с правого конца строки. Если запрошенная операция удаления превышает длину строки, возвращается пустая строка. |
endsWith | Проверяет, заканчивается ли строка предоставленной строкой. |
equals | Оператор сравнения на равенство. Аналогично оператору ==. |
equalsIgnoreCase | Оператор сравнения на равенство без учета регистра. Аналогично оператору <=>. |
escape | Экранирует строку в соответствии с форматом. Литеральные значения допустимого формата: "json", "xml", "ecmascript", "html", "java". |
expr | Преобразовывает строку в выражение. Это эквивалентно написанию выражения в нелитеральной форме и может использоваться для передачи параметров в виде строковых значений. |
factorial | Вычисляет факториал числа. |
false | Всегда возвращает значение false. Используйте функцию syntax(false()) , если есть столбец с именем false. |
floor | Возвращает наибольшее целое число, не превышающее заданное число. |
fromBase64 | Декодирует заданную строку в кодировке Base64. |
greater | Оператор сравнения "больше". Аналогично оператору >. |
greaterOrEqual | Оператор сравнения "больше чем или равно". Аналогично оператору >=. |
greatest | Возвращает наибольшее значение из списка значений в качестве пропускающих значения NULL. Возвращает значение NULL, если все входные данные имеют значение NULL. |
hasColumn | Проверяет значение столбца по имени в потоке. В качестве второго аргумента вы можете передать необязательное имя потока. Имена столбцов, известные во время проектирования, должны определяться только по имени. Вычисленные входные данные не поддерживаются, но вы можете использовать подстановку параметров. |
hasError | Проверяет, помечено ли утверждение с указанным идентификатором как ошибка. |
iif | В зависимости от условия применяется одно или другое значение. Если другое значение не указано, считается, что оно имеет значение NULL. Оба значения должны быть совместимыми (числовыми, строковыми...). |
iifNull | При наличии двух или более входных данных возвращает первый элемент, не имеющий значение NULL. Эта функция эквивалентна функции объединения. |
initCap | Преобразует первую букву каждого слова в верхний регистр. Слова идентифицируются по разделению пробелами. |
instr | Находит позицию (на основе 1) подстроки в строке. Если позиция не найдена, возвращается 0. |
isDelete | Проверяет, помечена ли строка для удаления. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isError | Проверяет, помечена ли строка как ошибка. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isIgnore | Проверяет, помечена ли строка для игнорирования. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isInsert | Проверяет, помечена ли строка для вставки. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isMatch | Проверяет соответствие строки при поиске. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isNull | Проверяет, равно ли значение NULL. |
isUpdate | Проверяет, помечена ли строка для обновления. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
isUpsert | Проверяет, помечена ли строка для вставки. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1. |
jaroWinkler | Вычисляет расстояние Джаро — Винклера между двумя строками. |
least | Оператор сравнения "меньше чем или равно". Аналогично оператору <=. |
left | Извлекает подстроку, начиная с индекса 1, с необходимым количеством знаков. Аналогично выражению SUBSTRING(str, 1, n). |
length | Возвращает длину строки. |
lesser | Оператор сравнения "меньше". Аналогично оператору <. |
lesserOrEqual | Оператор сравнения "меньше чем или равно". Аналогично оператору <=. |
levenshtein | Вычисляет расстояние Левенштейна между двумя строками. |
like | Шаблон представляет собой строку, которая сопоставляется буквально. Исключениями являются следующие специальные символы: _ соответствует любому одному знаку во входной строке (аналогично . в регулярных выражениях posix ). |
locate | Находит позицию (на основе 1) подстроки в строке, начиная определение с определенной позиции. Если позиция опущена, то она отсчитывается с начала строки. Если позиция не найдена, возвращается 0. |
log | Вычисляет значение логарифма. Вы можете предоставить необязательное основание, иначе используется число Эйлера. |
log10 | Вычисляет значение логарифма с основанием 10. |
lower | Преобразовывает строку в нижний регистр. |
lpad | Слева дополняет строку прилагаемым отступом определенной длины. Если строка соответствует заданной длине или превышает ее, она обрезается до этой длины. |
ltrim | Обрезает строку начальных знаков слева. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре. |
md5 | Вычисляет хэш-код MD5 набора столбцов с различными типами данных и возвращает шестнадцатеричную строку из 32 знаков. Может использоваться для вычисления отпечатка строки. |
minus | Вычитает числа. Вычитает количество дней из даты. Вычитает длительность из метки времени. Вычитает две метки времени, чтобы получить разницу в миллисекундах. Аналогично оператору -. |
mod (модуль) | Модуль пары чисел. Аналогично оператору %. |
multiply | Умножает пару чисел. Аналогично оператору *. |
negate | Инвертирует число. Преобразовывает положительные числа в отрицательные и наоборот. |
nextSequence | Возвращает следующую уникальную последовательность. Число является последовательным только в пределах секции и начинается с префикса в виде идентификатора секции. |
normalize | Нормализирует значение строки для разделения диакритических знаков Юникода. |
не | Оператор логического отрицания. |
notEquals | Оператор сравнения на неравенство. Аналогично оператору !=. |
NULL | Возвращает значение NULL. Используйте функцию syntax(null()) , если есть столбец с именем null. Любая операция, которая использует этот столбец, будет возвращать значение NULL. |
or | Логический оператор ИЛИ. Аналогично оператору ||. |
pMod | Положительный модуль пары чисел. |
partitionId | Возвращает идентификатор текущей секции, в которой находится входная строка. |
power | Возводит одно число в степень другого. |
radians | Преобразует градусы в радианы |
random | Возвращает случайное число при заданном необязательном начальном значении в секции. Начальное значение должно быть фиксированным значением. Оно используется в сочетании с partitionId для получения случайных значений. |
regexExtract | Извлекает соответствующую подстроку для данного шаблона регулярного выражения. Последний параметр идентифицирует группу для сопоставления и, если не указан, по умолчанию равен 1. Используйте `<regex>` (обратные кавычки) для сопоставления строки без экранирования. |
regexMatch | Проверяет, соответствует ли строка заданному шаблону регулярного выражения. Используйте `<regex>` (обратные кавычки) для сопоставления строки без экранирования. |
regexReplace | Заменяет все вхождения шаблона регулярного выражения другой подстрокой в данной строке. Используйте `<regex>` (обратные кавычки), чтобы сопоставить строку без экранирования. |
regexSplit | Разбивает строку по разделителю на основе регулярного выражения и возвращает массив строк. |
replace | Заменяет все вхождения подстроки другой подстрокой в заданной строке. Если параметр не указан, по умолчанию он равен пустой сроке. |
reverse | Обращает порядок строки. |
right | Извлекает подстроку с количеством знаков справа. Аналогично выражению SUBSTRING(str, LENGTH(str) - n, n). |
rlike | Проверяет, соответствует ли строка заданному шаблону регулярного выражения. |
round | Округляет число с учетом дополнительного масштаба и режима округления. Если масштаб не указан, по умолчанию используется значение 0. Если режим не указан, по умолчанию используется значение ROUND_HALF_UP(5). Возможно округление значений. |
rpad | Дополняет строку прилагаемым отступом справа до достижения определенной длины. Если строка соответствует заданной длине или превышает ее, она обрезается до этой длины. |
rtrim | Обрезает строку конечных знаков справа. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре. |
sha1 | Вычисляет хэш-код SHA-1 набора столбцов с различными типами данных и возвращает шестнадцатеричную строку из 40 знаков. Может использоваться для вычисления отпечатка строки. |
sha2 | Вычисляет хэш-код SHA-2 набора столбцов различных примитивных типов данных с заданной разрядностью, которая может иметь только значения 0(256), 224, 256, 384, 512. Может использоваться для вычисления отпечатка строки. |
sin | Вычисляет значение синуса. |
sinh | Вычисляет значение гиперболического синуса. |
soundex | Возвращает код soundex для строки. |
split | Разделяет строку на основе разделителя и возвращает массив строк. |
sqrt | Вычисляет квадратный корень числа. |
startsWith | Проверяет, начинается ли строка с предоставленной строки. |
substring | Извлекает подстроку определенной длины из заданной позиции. Позиция отсчитывается от единицы. Если длина опущена, то по умолчанию позиция отсчитывается от конца строки. |
substringIndex | Извлекает подстроку перед count вхождениями разделителя. Если count является положительным, возвращается все слева от последнего разделителя (слева направо). Если count является отрицательным, возвращается все справа от последнего разделителя (справа налево). |
tan | Вычисляет значение тангенса. |
tanh | Вычисляет значение гиперболического тангенса. |
translate | Заменяет один набор знаков другим набором знаков в строке. Знаки заменяются 1 к 1. |
trim | Обрезает строку начальных и конечных знаков. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре. |
true | Всегда возвращает истинное значение. Используйте функцию syntax(true()) , если есть столбец с именем true. |
typeMatch | Сопоставляет тип столбца. Может использоваться только в выражениях шаблонов. Число соответствует типу short, integer, long, double, float или decimal. Целое число соответствует типу short, integer или long. Дробное число соответствует типу double, float или decimal. Дата и время соответствуют типу date или timestamp. |
unescape | Отменяет экранирование строки в соответствии с форматом. Литеральные значения допустимого формата: "json", "xml", "ecmascript", "html", "java". |
upper | Преобразовывает строку в верхний регистр. |
uuid | Возвращает созданный UUID. |
xor | Логический оператор XOR. Аналогично оператору ^. |
Связанный контент
- Список всех агрегатных функций.
- Список всех функций массивов.
- Список всех функций кэшированного поиска.
- Список всех функций преобразования.
- Список всех функций даты и времени.
- Список всех функций сопоставления.
- Список всех метафункций.
- Список всех оконных функций.
- Сведения об использовании всех выражений преобразования данных.
- Создание выражений в потоке данных для сопоставления