Агрегатные функции в потоке данных для сопоставления
ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics
Совет
Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !
Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.
В следующих статьях приведены сведения об агрегатных функциях, поддерживаемых Фабрикой данных Azure и Azure Synapse Analytics в потоках данных для сопоставления.
Список агрегатных функций
Следующие функции доступны только в преобразованиях агрегатов, сводок, отмены свертывания и окон.
Агрегатная функция | Задача |
---|---|
approxDistinctCount | Возвращает приблизительное общее число различных значений для столбца. Необязательный второй параметр предназначен для управления ошибкой оценки. |
avg | Возвращает среднее значение столбца. |
avgIf | Возвращает среднее значение столбца на основе критериев. |
collect | Собирает все значения выражения в агрегированной группе в массив. Во время этого процесса структуры можно собирать и преобразовывать в альтернативные структуры. Количество элементов будет равно количеству строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим. |
collectUnique | Собирает все значения выражения в агрегированной группе в уникальный массив. Структуры можно собирать и преобразовывать в альтернативные структуры во время этого процесса. Число элементов будет меньше или равно числу строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим. |
count | Возвращает совокупное количество значений. Если указан дополнительный столбец (столбцы), это выражение игнорирует значения NULL в операторе COUNT. |
countAll | Получает совокупное количество значений, включая значения NULL. |
countDistinct | Возвращает совокупное число различных значений набора столбцов. |
countAllDistinct | Получает совокупное количество отдельных значений набора столбцов, включая значения NULL. |
countIf | Возвращает совокупное количество значений на основе критериев. Если указан дополнительный столбец, выражение игнорирует значения NULL в операторе COUNT. |
covariancePopulation | Возвращает ковариацию по всей совокупности значений двух столбцов. |
covariancePopulationIf | Возвращает ковариацию по всей совокупности значений двух столбцов на основе критериев. |
covarianceSample | Возвращает ковариацию выборки двух столбцов. |
covarianceSampleIf | Возвращает ковариацию выборки двух столбцов на основе критериев. |
first | Возвращает первое значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false. |
isDistinct | Определяет, является ли столбец или набор столбцов уникальным. Значение NULL не учитывается как отдельное значение |
kurtosis | Возвращает эксцесс столбца. |
kurtosisIf | Возвращает эксцесс столбца на основе критериев. |
last | Возвращает последнее значение группы столбцов. Если второй параметр ignoreNulls опущен, считается, что он имеет значение false. |
max | Возвращает максимальное значение столбца. |
maxIf | Возвращает максимальное значение столбца на основе критериев. |
mean | Возвращает среднее значение столбца. Аналогично оператору AVG. |
meanIf | Возвращает среднее значение столбца на основе критериев. Аналогично оператору avgIf. |
min | Возвращает минимальное значение столбца. |
minIf | Возвращает минимальное значение столбца на основе критериев. |
skewness | Возвращает асимметрию столбца. |
skewnessIf | Возвращает асимметрию столбца на основе критериев. |
stddev | Возвращает стандартное отклонение для столбца. |
stddevIf | Возвращает стандартное отклонение для столбца на основе критериев. |
stddevPopulation | Возвращает стандартное отклонение по всей совокупности значений столбца. |
stddevPopulationIf | Возвращает стандартное отклонение по всей совокупности значений столбца на основе критериев. |
stddevSample | Возвращает выборочное стандартное отклонение для столбца. |
stddevSampleIf | Возвращает выборочное стандартное отклонение для столбца на основе критериев. |
sum | Возвращает общую сумму числового столбца. |
sumDistinct | Возвращает общую сумму различных значений числового столбца. |
sumDistinctIf | Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце. |
sumIf | Возвращает общую сумму числового столбца на основе критериев. Условие может быть основано на любом столбце. |
topN | Получает значения topN для этого столбца. |
variance | Возвращает дисперсию столбца. |
varianceIf | Возвращает дисперсию столбца на основе критериев. |
variancePopulation | Возвращает дисперсию по всей совокупности значений столбца. |
variancePopulationIf | Возвращает дисперсию по всей совокупности значений столбца на основе критериев. |
varianceSample | Возвращает несмещенную дисперсию столбца. |
varianceSampleIf | Возвращает несмещенную дисперсию столбца на основе критериев. |
Связанный контент
- Список всех функций массивов.
- Список всех функций кэшированного поиска.
- Список всех функций преобразования.
- Список всех функций даты и времени.
- Список всех функций выражений.
- Список всех функций сопоставления.
- Список всех метафункций.
- Список всех оконных функций.
- Сведения об использовании всех выражений преобразования данных.
- Создание выражений в потоке данных для сопоставления