Поделиться через


Подключаемый модуль basket

Область применения: ✅Microsoft Fabric✅Azure Data Explorer

Подключаемый basket модуль находит частые шаблоны атрибутов в данных и возвращает шаблоны, которые передают порог частоты в этих данных. Шаблон представляет подмножество строк с одинаковым значением в одном или нескольких столбцах. Подключаемый basket модуль основан на алгоритме Apriori, первоначально разработанном для анализа данных корзины.

Синтаксис

Tevaluate ( | basket [ Пороговое значение, WeightColumn, MaxDimensions, CustomWildcard CustomWildcard,, ... ])

Дополнительные сведения о соглашениях синтаксиса.

Параметры

Имя (название) Type Обязательно Описание
Threshold long Диапазон double от 0,015 до 1, который задает минимальное соотношение строк, которые следует считать частыми. Шаблоны с меньшим соотношением не будут возвращены. Значение по умолчанию — 0.05. Чтобы использовать значение по умолчанию, введите тильду: ~.

Пример: T | evaluate basket(0.02)
WeightColumn string Имя столбца, используемое для рассмотрения каждой строки во входных данных в соответствии с указанным весом. Должно быть именем числового столбца типа, например int, longreal. По умолчанию каждая строка имеет вес 1. Чтобы использовать значение по умолчанию, введите тильду: ~. Как правило, при использовании столбца с весовым коэффициентом следует учитывать выборку, группирование или агрегирование данных, внедренных в каждой строке.

Пример: T | evaluate basket('~', sample_Count)
MaxDimensions int Задает максимальное количество несвязанных измерений для каждой корзины, ограниченной по умолчанию, чтобы свести к минимуму среду выполнения запроса. Значение по умолчанию равно 5. Чтобы использовать значение по умолчанию, введите тильду: ~.

Пример: T | evaluate basket('~', '~', 3)
CustomWildcard string Задает подстановочный знак для определенного типа в таблице результатов, который укажет, что текущий шаблон не имеет ограничения по этому столбцу. Значение по умолчанию за исключением строковых столбцов, значение по умолчанию null которых является пустой строкой. Если значение по умолчанию является хорошим значением в данных, следует использовать другое подстановочное значение, например *. Чтобы использовать значение по умолчанию, введите тильду: ~.

Пример: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Примечание.

Чтобы указать необязательный параметр, который следует за необязательным параметром, обязательно укажите значение для предыдущего необязательного параметра. Дополнительные сведения см. в разделе "Работа с необязательными параметрами".

Возвраты

Подключаемый basket модуль возвращает частые шаблоны, которые передают пороговое значение коэффициента. Пороговое значение по умолчанию — 0,05.

В результатах каждый шаблон соответствует строке. Первый столбец — это идентификатор сегмента. Следующие два столбца — это количество и процент строк из исходного запроса, соответствующего шаблону. Остальные столбцы относятся к исходному запросу с определенным значением из столбца или подстановочным знаком, который по умолчанию имеет значение NULL, то есть значение переменной.

Примечание.

Алгоритм использует выборку для определения начальных частых значений. Таким образом, результаты могут немного отличаться между несколькими запусками для шаблонов, частота которых близка к пороговой значению.

Пример

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Выходные данные

Идентификатор сегмента Count Процент Штат EventType Damage DamageCrops
0 4574 77,7 Нет 0
1 2278 38,7 Град Нет 0
2 5675 96,4 0
3 2371 40,3 Град 0
4 1279 21,7 Ураганный ветер 0
5 2468 41,9 Град
6 1310 22,3 Да
7 1291 21,9 Ураганный ветер

Примеры с пользовательскими подстановочными знаками

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Выходные данные

Идентификатор сегмента Count Процент Штат EventType Damage DamageCrops
0 4574 77,7 * * Нет 0
1 2278 38,7 * Град Нет 0
2 5675 96,4 * * * 0
3 2371 40,3 * Град * 0
4 1279 21,7 * Ураганный ветер * 0
5 2468 41,9 * Град * -1
6 1310 22,3 * * Да -1
7 1291 21,9 * Ураганный ветер * -1