Compartir a través de


Complemento basket

Se aplica a: ✅Microsoft FabricAzure Data Explorer

El basket complemento busca patrones frecuentes de atributos en los datos y devuelve los patrones que pasan un umbral de frecuencia en esos datos. Un patrón representa un subconjunto de las filas que tienen el mismo valor en una o varias columnas. El basket complemento se basa en el algoritmo Apriori desarrollado originalmente para la minería de datos de análisis de cesta.

Sintaxis

Tevaluate ( | basket [ Threshold, WeightColumn, MaxDimensions, CustomWildcard, CustomWildcard, ... ])

Obtenga más información sobre las convenciones de sintaxis.

Parámetros

Nombre Type Obligatorio Descripción
Umbral long en double el intervalo de 0,015 a 1 que establece la relación mínima de las filas que se deben considerar frecuentes. No se devolverán patrones con una relación menor. El valor predeterminado es 0,05. Para usar el valor predeterminado, escriba la tilde: ~.

Ejemplo: T | evaluate basket(0.02)
WeightColumn string Nombre de columna que se va a usar para tener en cuenta cada fila de la entrada según el peso especificado. Debe ser un nombre de una columna de tipo numérico, como int, long, real. De forma predeterminada, cada fila tiene un peso de 1. Para usar el valor predeterminado, escriba la tilde: ~. Un uso común de una columna de peso es tener en cuenta el muestreo o la creación de depósitos y la agregación de los datos que ya se han incrustado en cada fila.

Ejemplo: T | evaluate basket('~', sample_Count)
MaxDimensions int Establece el número máximo de dimensiones no correlacionadas por cesta, limitada de forma predeterminada, para minimizar el tiempo de ejecución de la consulta. El valor predeterminado es 5. Para usar el valor predeterminado, escriba la tilde: ~.

Ejemplo: T | evaluate basket('~', '~', 3)
CustomWildcard string Establece el valor de carácter comodín para un tipo específico en la tabla de resultados que indicará que el patrón actual no tiene una restricción en esta columna. El valor predeterminado es null excepto para las columnas de cadena cuyo valor predeterminado es una cadena vacía. Si el valor predeterminado es un buen valor en los datos, se debe usar un valor comodín diferente, como *. Para usar el valor predeterminado, escriba la tilde: ~.

Ejemplo: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Nota:

Para especificar un parámetro opcional que sigue a un parámetro opcional, asegúrese de proporcionar un valor para el parámetro opcional anterior. Para obtener más información, vea Trabajar con parámetros opcionales.

Devoluciones

El basket complemento devuelve patrones frecuentes que pasan un umbral de proporción. El umbral predeterminado es 0,05.

Cada patrón se representa mediante una fila en los resultados. La primera columna es el identificador de segmento. Las dos columnas siguientes son el recuento y el porcentaje de filas de la consulta original que coinciden con el patrón. Las columnas restantes se relacionan con la consulta original, con un valor específico de la columna o un valor comodín, que es null de forma predeterminada, lo que significa un valor variable.

Nota:

El algoritmo usa el muestreo para determinar los valores frecuentes iniciales. Por lo tanto, los resultados podrían diferir ligeramente entre varias ejecuciones para patrones cuya frecuencia está cerca del umbral.

Ejemplo

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Salida

SegmentId Count Porcentaje State EventType Daños DamageCrops
0 4574 77,7 NO 0
1 2278 38,7 Granizo NO 0
2 5675 96,4 0
3 2371 40,3 Granizo 0
4 1279 21,7 Viento de tormenta 0
5 2468 41,9 Granizo
6 1310 22.3
7 1291 21,9 Viento de tormenta

Ejemplo con caracteres comodín personalizados

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Salida

SegmentId Count Porcentaje State EventType Daños DamageCrops
0 4574 77,7 * * NO 0
1 2278 38,7 * Granizo NO 0
2 5675 96,4 * * * 0
3 2371 40,3 * Granizo * 0
4 1279 21,7 * Viento de tormenta * 0
5 2468 41,9 * Granizo * -1
6 1310 22.3 * * -1
7 1291 21,9 * Viento de tormenta * -1