Complemento basket
Se aplica a: ✅Microsoft Fabric✅Azure Data Explorer
El basket
complemento busca patrones frecuentes de atributos en los datos y devuelve los patrones que pasan un umbral de frecuencia en esos datos. Un patrón representa un subconjunto de las filas que tienen el mismo valor en una o varias columnas. El basket
complemento se basa en el algoritmo Apriori desarrollado originalmente para la minería de datos de análisis de cesta.
Sintaxis
Tevaluate
(
| basket
[ Threshold,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
Obtenga más información sobre las convenciones de sintaxis.
Parámetros
Nombre | Type | Obligatorio | Descripción |
---|---|---|---|
Umbral | long |
en double el intervalo de 0,015 a 1 que establece la relación mínima de las filas que se deben considerar frecuentes. No se devolverán patrones con una relación menor. El valor predeterminado es 0,05. Para usar el valor predeterminado, escriba la tilde: ~ .Ejemplo: T | evaluate basket(0.02) |
|
WeightColumn | string |
Nombre de columna que se va a usar para tener en cuenta cada fila de la entrada según el peso especificado. Debe ser un nombre de una columna de tipo numérico, como int , long , real . De forma predeterminada, cada fila tiene un peso de 1. Para usar el valor predeterminado, escriba la tilde: ~ . Un uso común de una columna de peso es tener en cuenta el muestreo o la creación de depósitos y la agregación de los datos que ya se han incrustado en cada fila.Ejemplo: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Establece el número máximo de dimensiones no correlacionadas por cesta, limitada de forma predeterminada, para minimizar el tiempo de ejecución de la consulta. El valor predeterminado es 5. Para usar el valor predeterminado, escriba la tilde: ~ .Ejemplo: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Establece el valor de carácter comodín para un tipo específico en la tabla de resultados que indicará que el patrón actual no tiene una restricción en esta columna. El valor predeterminado es null excepto para las columnas de cadena cuyo valor predeterminado es una cadena vacía. Si el valor predeterminado es un buen valor en los datos, se debe usar un valor comodín diferente, como * . Para usar el valor predeterminado, escriba la tilde: ~ .Ejemplo: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Nota:
Para especificar un parámetro opcional que sigue a un parámetro opcional, asegúrese de proporcionar un valor para el parámetro opcional anterior. Para obtener más información, vea Trabajar con parámetros opcionales.
Devoluciones
El basket
complemento devuelve patrones frecuentes que pasan un umbral de proporción. El umbral predeterminado es 0,05.
Cada patrón se representa mediante una fila en los resultados. La primera columna es el identificador de segmento. Las dos columnas siguientes son el recuento y el porcentaje de filas de la consulta original que coinciden con el patrón. Las columnas restantes se relacionan con la consulta original, con un valor específico de la columna o un valor comodín, que es null de forma predeterminada, lo que significa un valor variable.
Nota:
El algoritmo usa el muestreo para determinar los valores frecuentes iniciales. Por lo tanto, los resultados podrían diferir ligeramente entre varias ejecuciones para patrones cuya frecuencia está cerca del umbral.
Ejemplo
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Salida
SegmentId | Count | Porcentaje | State | EventType | Daños | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | NO | 0 | ||
1 | 2278 | 38,7 | Granizo | NO | 0 | |
2 | 5675 | 96,4 | 0 | |||
3 | 2371 | 40,3 | Granizo | 0 | ||
4 | 1279 | 21,7 | Viento de tormenta | 0 | ||
5 | 2468 | 41,9 | Granizo | |||
6 | 1310 | 22.3 | SÍ | |||
7 | 1291 | 21,9 | Viento de tormenta |
Ejemplo con caracteres comodín personalizados
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Salida
SegmentId | Count | Porcentaje | State | EventType | Daños | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | * | * | NO | 0 |
1 | 2278 | 38,7 | * | Granizo | NO | 0 |
2 | 5675 | 96,4 | * | * | * | 0 |
3 | 2371 | 40,3 | * | Granizo | * | 0 |
4 | 1279 | 21,7 | * | Viento de tormenta | * | 0 |
5 | 2468 | 41,9 | * | Granizo | * | -1 |
6 | 1310 | 22.3 | * | * | SÍ | -1 |
7 | 1291 | 21,9 | * | Viento de tormenta | * | -1 |