Поделиться через


Функции выражений в потоке данных для сопоставления

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

В следующих статьях приведены сведения о функциях выражений, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.

Список функций выражений

В Фабрике данных и конвейерах Synapse для настройки преобразований данных используйте язык выражений функции потока данных для сопоставления.

Функция выражения Задача
abs Абсолютное значение числа.
acos Вычисляет значение арккосинуса.
добавление Добавляет пару строк или чисел. Добавляет дату к числу дней. Добавляет длительность в метку времени. Добавляет один массив аналогичного типа к другому. Аналогично оператору +.
and Логический оператор И. Аналогично оператору &&.
asin Вычисляет значение арксинуса.
assertErrorMessages Возвращает сопоставление всех сообщений утверждения.
atan Вычисляет значение арктангенса.
atan2 Возвращает угол в радианах между положительной осью x плоскости и точкой, заданной координатами.
between Проверяет, находится ли первое значение между двумя другими значениями включительно. Можно сравнить числовые, строковые и значения даты и времени.
bitwiseAnd Побитовый оператор "И" для целочисленных типов. То же, что и оператор >.
bitwiseOr Побитовый оператор "ИЛИ" для целочисленных типов. Аналогично оператору |.
bitwiseXor Побитовый оператор "ИЛИ" для целочисленных типов. Аналогично оператору |.
blake2b Вычисляет хэш Blake2 набора столбцов различных примитивных типов данных с заданной разрядностью. Разрядность может быть только кратна 8 и должна быть в диапазоне от 8 до 512. Может использоваться для вычисления отпечатка строки.
blake2bBinary Вычисляет дайджест Blake2 набора столбцов различных примитивных типов данных с заданной битовой длиной, которая может быть несколько 8 от 8 до 512. Может использоваться для вычисления отпечатка строки.
case На основе чередующихся условий применяется одно или другое значение. Если входные числа четные, другим значением для последнего условия по умолчанию является NULL.
cbrt Вычисляет кубический корень числа.
ceil Возвращает наименьшее целое число, не меньшее заданного числа.
coalesce Возвращает из набора входных данных первое значение, не равное NULL. Все входные данные должны быть одного типа.
columnNames Получает имена всех выходных столбцов для потока. Можно передать необязательное имя потока в качестве первого аргумента и необязательный второй аргумент, чтобы возвращались только столбцы смещения схемы.
columns Получает значения всех выходных столбцов для потока. В качестве второго аргумента вы можете передать необязательное имя потока.
compare Сравнивает два значения одного типа. Возвращает отрицательное целое число, если значение1 < значение2, 0 — если значение1 == значение2, и положительное значение, если значение1 > значение2.
concat Объединяет переменное количество строк. Аналогично оператору + со строками.
concatWS Объединяет переменное количество строк с использованием разделителя. Первый параметр — это разделитель.
cos Вычисляет значение косинуса.
cosh Вычисляет значение гиперболического косинуса.
crc32 Вычисляет хэш-код CRC32 набора столбцов различных примитивных типов данных с заданной разрядностью. Разрядность должна иметь значение 0(256), 224, 256, 384 или 512. Может использоваться для вычисления отпечатка строки.
degrees Преобразует радианы в градусы.
divide Делит пару чисел. Аналогично оператору /.
dropLeft Удаляет столько же символов с левого конца строки. Если запрошенная операция удаления превышает длину строки, возвращается пустая строка.
dropRight Удаляет столько же символов с правого конца строки. Если запрошенная операция удаления превышает длину строки, возвращается пустая строка.
endsWith Проверяет, заканчивается ли строка предоставленной строкой.
equals Оператор сравнения на равенство. Аналогично оператору ==.
equalsIgnoreCase Оператор сравнения на равенство без учета регистра. Аналогично оператору <=>.
escape Экранирует строку в соответствии с форматом. Литеральные значения допустимого формата: "json", "xml", "ecmascript", "html", "java".
expr Преобразовывает строку в выражение. Это эквивалентно написанию выражения в нелитеральной форме и может использоваться для передачи параметров в виде строковых значений.
factorial Вычисляет факториал числа.
false Всегда возвращает значение false. Используйте функцию syntax(false()), если есть столбец с именем false.
floor Возвращает наибольшее целое число, не превышающее заданное число.
fromBase64 Декодирует заданную строку в кодировке Base64.
greater Оператор сравнения "больше". Аналогично оператору >.
greaterOrEqual Оператор сравнения "больше чем или равно". Аналогично оператору >=.
greatest Возвращает наибольшее значение из списка значений в качестве пропускающих значения NULL. Возвращает значение NULL, если все входные данные имеют значение NULL.
hasColumn Проверяет значение столбца по имени в потоке. В качестве второго аргумента вы можете передать необязательное имя потока. Имена столбцов, известные во время проектирования, должны определяться только по имени. Вычисленные входные данные не поддерживаются, но вы можете использовать подстановку параметров.
hasError Проверяет, помечено ли утверждение с указанным идентификатором как ошибка.
iif В зависимости от условия применяется одно или другое значение. Если другое значение не указано, считается, что оно имеет значение NULL. Оба значения должны быть совместимыми (числовыми, строковыми...).
iifNull При наличии двух или более входных данных возвращает первый элемент, не имеющий значение NULL. Эта функция эквивалентна функции объединения.
initCap Преобразует первую букву каждого слова в верхний регистр. Слова идентифицируются по разделению пробелами.
instr Находит позицию (на основе 1) подстроки в строке. Если позиция не найдена, возвращается 0.
isDelete Проверяет, помечена ли строка для удаления. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isError Проверяет, помечена ли строка как ошибка. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isIgnore Проверяет, помечена ли строка для игнорирования. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isInsert Проверяет, помечена ли строка для вставки. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isMatch Проверяет соответствие строки при поиске. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isNull Проверяет, равно ли значение NULL.
isUpdate Проверяет, помечена ли строка для обновления. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
isUpsert Проверяет, помечена ли строка для вставки. Для преобразований, которые принимают более одного входного потока, можно передавать индекс потока (отсчитываемый от единицы). Индекс потока должен быть равен 1 или 2, а значение по умолчанию — 1.
jaroWinkler Вычисляет расстояние Джаро — Винклера между двумя строками.
least Оператор сравнения "меньше чем или равно". Аналогично оператору <=.
left Извлекает подстроку, начиная с индекса 1, с необходимым количеством знаков. Аналогично выражению SUBSTRING(str, 1, n).
length Возвращает длину строки.
lesser Оператор сравнения "меньше". Аналогично оператору <.
lesserOrEqual Оператор сравнения "меньше чем или равно". Аналогично оператору <=.
levenshtein Вычисляет расстояние Левенштейна между двумя строками.
like Шаблон представляет собой строку, которая сопоставляется буквально. Исключениями являются следующие специальные символы: _ соответствует любому одному знаку во входной строке (аналогично . в регулярных выражениях posix).
locate Находит позицию (на основе 1) подстроки в строке, начиная определение с определенной позиции. Если позиция опущена, то она отсчитывается с начала строки. Если позиция не найдена, возвращается 0.
log Вычисляет значение логарифма. Вы можете предоставить необязательное основание, иначе используется число Эйлера.
log10 Вычисляет значение логарифма с основанием 10.
lower Преобразовывает строку в нижний регистр.
lpad Слева дополняет строку прилагаемым отступом определенной длины. Если строка соответствует заданной длине или превышает ее, она обрезается до этой длины.
ltrim Обрезает строку начальных знаков слева. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре.
md5 Вычисляет хэш-код MD5 набора столбцов с различными типами данных и возвращает шестнадцатеричную строку из 32 знаков. Может использоваться для вычисления отпечатка строки.
minus Вычитает числа. Вычитает количество дней из даты. Вычитает длительность из метки времени. Вычитает две метки времени, чтобы получить разницу в миллисекундах. Аналогично оператору -.
mod (модуль) Модуль пары чисел. Аналогично оператору %.
multiply Умножает пару чисел. Аналогично оператору *.
negate Инвертирует число. Преобразовывает положительные числа в отрицательные и наоборот.
nextSequence Возвращает следующую уникальную последовательность. Число является последовательным только в пределах секции и начинается с префикса в виде идентификатора секции.
normalize Нормализирует значение строки для разделения диакритических знаков Юникода.
не Оператор логического отрицания.
notEquals Оператор сравнения на неравенство. Аналогично оператору !=.
NULL Возвращает значение NULL. Используйте функцию syntax(null()), если есть столбец с именем null. Любая операция, которая использует этот столбец, будет возвращать значение NULL.
or Логический оператор ИЛИ. Аналогично оператору ||.
pMod Положительный модуль пары чисел.
partitionId Возвращает идентификатор текущей секции, в которой находится входная строка.
power Возводит одно число в степень другого.
radians Преобразует градусы в радианы
random Возвращает случайное число при заданном необязательном начальном значении в секции. Начальное значение должно быть фиксированным значением. Оно используется в сочетании с partitionId для получения случайных значений.
regexExtract Извлекает соответствующую подстроку для данного шаблона регулярного выражения. Последний параметр идентифицирует группу для сопоставления и, если не указан, по умолчанию равен 1. Используйте `<regex>` (обратные кавычки) для сопоставления строки без экранирования.
regexMatch Проверяет, соответствует ли строка заданному шаблону регулярного выражения. Используйте `<regex>` (обратные кавычки) для сопоставления строки без экранирования.
regexReplace Заменяет все вхождения шаблона регулярного выражения другой подстрокой в ​​данной строке. Используйте `<regex>` (обратные кавычки), чтобы сопоставить строку без экранирования.
regexSplit Разбивает строку по разделителю на основе регулярного выражения и возвращает массив строк.
replace Заменяет все вхождения подстроки другой подстрокой в ​​заданной строке. Если параметр не указан, по умолчанию он равен пустой сроке.
reverse Обращает порядок строки.
right Извлекает подстроку с количеством знаков справа. Аналогично выражению SUBSTRING(str, LENGTH(str) - n, n).
rlike Проверяет, соответствует ли строка заданному шаблону регулярного выражения.
round Округляет число с учетом дополнительного масштаба и режима округления. Если масштаб не указан, по умолчанию используется значение 0. Если режим не указан, по умолчанию используется значение ROUND_HALF_UP(5). Возможно округление значений.
rpad Дополняет строку прилагаемым отступом справа до достижения определенной длины. Если строка соответствует заданной длине или превышает ее, она обрезается до этой длины.
rtrim Обрезает строку конечных знаков справа. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре.
sha1 Вычисляет хэш-код SHA-1 набора столбцов с различными типами данных и возвращает шестнадцатеричную строку из 40 знаков. Может использоваться для вычисления отпечатка строки.
sha2 Вычисляет хэш-код SHA-2 набора столбцов различных примитивных типов данных с заданной разрядностью, которая может иметь только значения 0(256), 224, 256, 384, 512. Может использоваться для вычисления отпечатка строки.
sin Вычисляет значение синуса.
sinh Вычисляет значение гиперболического синуса.
soundex Возвращает код soundex для строки.
split Разделяет строку на основе разделителя и возвращает массив строк.
sqrt Вычисляет квадратный корень числа.
startsWith Проверяет, начинается ли строка с предоставленной строки.
substring Извлекает подстроку определенной длины из заданной позиции. Позиция отсчитывается от единицы. Если длина опущена, то по умолчанию позиция отсчитывается от конца строки.
substringIndex Извлекает подстроку перед count вхождениями разделителя. Если count является положительным, возвращается все слева от последнего разделителя (слева направо). Если count является отрицательным, возвращается все справа от последнего разделителя (справа налево).
tan Вычисляет значение тангенса.
tanh Вычисляет значение гиперболического тангенса.
translate Заменяет один набор знаков другим набором знаков в строке. Знаки заменяются 1 к 1.
trim Обрезает строку начальных и конечных знаков. Если второй параметр не указан, удаляются пробелы. В противном случае обрезается любой знак, указанный во втором параметре.
true Всегда возвращает истинное значение. Используйте функцию syntax(true()), если есть столбец с именем true.
typeMatch Сопоставляет тип столбца. Может использоваться только в выражениях шаблонов. Число соответствует типу short, integer, long, double, float или decimal. Целое число соответствует типу short, integer или long. Дробное число соответствует типу double, float или decimal. Дата и время соответствуют типу date или timestamp.
unescape Отменяет экранирование строки в соответствии с форматом. Литеральные значения допустимого формата: "json", "xml", "ecmascript", "html", "java".
upper Преобразовывает строку в верхний регистр.
uuid Возвращает созданный UUID.
xor Логический оператор XOR. Аналогично оператору ^.