Compartilhar via


Plug-in basket

Aplica-se a: ✅Microsoft FabricAzure Data Explorer

O basket plug-in encontra padrões frequentes de atributos nos dados e retorna os padrões que ultrapassam um limite de frequência nesses dados. Um padrão representa um subconjunto das linhas que têm o mesmo valor em uma ou mais colunas. O basket plugin é baseado no algoritmo Apriori originalmente desenvolvido para mineração de dados de análise de cesta.

Sintaxe

Tevaluate ( | basket [ Threshold, WeightColumn , MaxDimensions, CustomWildcard, CustomWildcard, ... ])

Saiba mais sobre as convenções de sintaxe.

Parâmetros

Nome Digitar Obrigatória Descrição
Limite long Um double no intervalo de 0,015 a 1 que define a proporção mínima das linhas a serem consideradas frequentes. Padrões com uma proporção menor não serão retornados. O valor padrão é 0,05. Para usar o valor padrão, insira o til: ~.

Exemplo: T | evaluate basket(0.02)
Coluna de peso string O nome da coluna a ser usado para considerar cada linha na entrada de acordo com o peso especificado. Deve ser um nome de uma coluna de tipo numérico, como int, long, real. Por padrão, cada linha tem um peso de 1. Para usar o valor padrão, insira o til: ~. Um uso comum de uma coluna de peso é para amostragem de conta ou agregação/segmentação de dados já incorporados a cada linha.

Exemplo: T | evaluate basket('~', sample_Count)
Dimensões máximas int Define o número máximo de dimensões não correlacionadas por cesta, limitado por padrão, para minimizar o tempo de execução da consulta. O padrão é 5. Para usar o valor padrão, insira o til: ~.

Exemplo: T | evaluate basket('~', '~', 3)
Curinga personalizado string Define o valor do curinga como um tipo específico na tabela de resultados, que indicará que o padrão atual não tem uma restrição para essa coluna. O padrão é null exceto para colunas de cadeia de caracteres cujo valor padrão é uma cadeia de caracteres vazia. Se o padrão for um bom valor nos dados, um valor curinga diferente deverá ser usado, como *. Para usar o valor padrão, insira o til: ~.

Exemplo: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Observação

Para especificar um parâmetro opcional que segue um parâmetro opcional, certifique-se de fornecer um valor para o parâmetro opcional anterior. Para obter mais informações, consulte Trabalhando com parâmetros opcionais.

Devoluções

O basket plug-in retorna padrões frequentes que ultrapassam um limite de proporção. O limite padrão é 0,05.

Cada padrão é representado por uma linha nos resultados. A primeira coluna é a ID do segmento. As próximas duas colunas são a contagem e a porcentagem de linhas, da consulta original que correspondem ao padrão. As colunas restantes estão relacionadas à consulta original, com um valor específico da coluna ou um valor curinga, que é nulo por padrão, o que significa um valor de variável.

Observação

O algoritmo usa amostragem para determinar os valores frequentes iniciais. Portanto, os resultados podem diferir ligeiramente entre várias execuções para padrões cuja frequência está próxima do limite.

Exemplo

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Saída

SegmentId Count Percentual Estado EventType Danos DamageCrops
0 4574 77.7 NO 0
1 2278 38.7 Granizo NO 0
2 5675 96.4 0
3 2371 40.3 Granizo 0
4 1279 21.7 Thunderstorm Wind 0
5 2468 41.9 Granizo
6 10:13 22.3 YES
7 1291 21.9 Thunderstorm Wind

Exemplo com curingas personalizados

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Saída

SegmentId Count Percentual Estado EventType Danos DamageCrops
0 4574 77.7 * * NO 0
1 2278 38.7 * Granizo NO 0
2 5675 96.4 * * * 0
3 2371 40.3 * Granizo * 0
4 1279 21.7 * Thunderstorm Wind * 0
5 2468 41.9 * Granizo * -1
6 10:13 22.3 * * YES -1
7 1291 21.9 * Thunderstorm Wind * -1