Подключаемый модуль basket
Область применения: ✅Microsoft Fabric✅Azure Data Explorer
Подключаемый basket
модуль находит частые шаблоны атрибутов в данных и возвращает шаблоны, которые передают порог частоты в этих данных. Шаблон представляет подмножество строк с одинаковым значением в одном или нескольких столбцах. Подключаемый basket
модуль основан на алгоритме Apriori, первоначально разработанном для анализа данных корзины.
Синтаксис
Tevaluate
(
| basket
[ Пороговое значение,
WeightColumn,
MaxDimensions,
CustomWildcard CustomWildcard,
,
... ])
Дополнительные сведения о соглашениях синтаксиса.
Параметры
Имя (название) | Type | Обязательно | Описание |
---|---|---|---|
Threshold | long |
Диапазон double от 0,015 до 1, который задает минимальное соотношение строк, которые следует считать частыми. Шаблоны с меньшим соотношением не будут возвращены. Значение по умолчанию — 0.05. Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket(0.02) |
|
WeightColumn | string |
Имя столбца, используемое для рассмотрения каждой строки во входных данных в соответствии с указанным весом. Должно быть именем числового столбца типа, например int , long real . По умолчанию каждая строка имеет вес 1. Чтобы использовать значение по умолчанию, введите тильду: ~ . Как правило, при использовании столбца с весовым коэффициентом следует учитывать выборку, группирование или агрегирование данных, внедренных в каждой строке.Пример: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Задает максимальное количество несвязанных измерений для каждой корзины, ограниченной по умолчанию, чтобы свести к минимуму среду выполнения запроса. Значение по умолчанию равно 5. Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Задает подстановочный знак для определенного типа в таблице результатов, который укажет, что текущий шаблон не имеет ограничения по этому столбцу. Значение по умолчанию за исключением строковых столбцов, значение по умолчанию null которых является пустой строкой. Если значение по умолчанию является хорошим значением в данных, следует использовать другое подстановочное значение, например * . Чтобы использовать значение по умолчанию, введите тильду: ~ .Пример: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Примечание.
Чтобы указать необязательный параметр, который следует за необязательным параметром, обязательно укажите значение для предыдущего необязательного параметра. Дополнительные сведения см. в разделе "Работа с необязательными параметрами".
Возвраты
Подключаемый basket
модуль возвращает частые шаблоны, которые передают пороговое значение коэффициента. Пороговое значение по умолчанию — 0,05.
В результатах каждый шаблон соответствует строке. Первый столбец — это идентификатор сегмента. Следующие два столбца — это количество и процент строк из исходного запроса, соответствующего шаблону. Остальные столбцы относятся к исходному запросу с определенным значением из столбца или подстановочным знаком, который по умолчанию имеет значение NULL, то есть значение переменной.
Примечание.
Алгоритм использует выборку для определения начальных частых значений. Таким образом, результаты могут немного отличаться между несколькими запусками для шаблонов, частота которых близка к пороговой значению.
Пример
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Выходные данные
Идентификатор сегмента | Count | Процент | Штат | EventType | Damage | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | Нет | 0 | ||
1 | 2278 | 38,7 | Град | Нет | 0 | |
2 | 5675 | 96,4 | 0 | |||
3 | 2371 | 40,3 | Град | 0 | ||
4 | 1279 | 21,7 | Ураганный ветер | 0 | ||
5 | 2468 | 41,9 | Град | |||
6 | 1310 | 22,3 | Да | |||
7 | 1291 | 21,9 | Ураганный ветер |
Примеры с пользовательскими подстановочными знаками
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Выходные данные
Идентификатор сегмента | Count | Процент | Штат | EventType | Damage | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | * | * | Нет | 0 |
1 | 2278 | 38,7 | * | Град | Нет | 0 |
2 | 5675 | 96,4 | * | * | * | 0 |
3 | 2371 | 40,3 | * | Град | * | 0 |
4 | 1279 | 21,7 | * | Ураганный ветер | * | 0 |
5 | 2468 | 41,9 | * | Град | * | -1 |
6 | 1310 | 22,3 | * | * | Да | -1 |
7 | 1291 | 21,9 | * | Ураганный ветер | * | -1 |