Freigeben über


basket-Plug-In

Gilt für: ✅Microsoft Fabric✅Azure Data Explorer

Das basket Plug-In findet häufige Muster von Attributen in den Daten und gibt die Muster zurück, die einen Häufigkeitsschwellenwert in diesen Daten übergeben. Ein Muster stellt eine Teilmenge der Zeilen dar, die denselben Wert in einer oder mehreren Spalten aufweisen. Das basket Plug-In basiert auf dem Apriori-Algorithmus, der ursprünglich für das Korbanalyse-Data Mining entwickelt wurde.

Syntax

T(evaluate basket | [ Threshold WeightColumn,, MaxDimensions, CustomWildcard CustomWildcard, , ... ])

Erfahren Sie mehr über Syntaxkonventionen.

Parameter

Name Type Erforderlich Beschreibung
Schwellenwert long A double im Bereich von 0,015 bis 1, der das minimale Verhältnis der Zeilen festlegt, die als häufig angesehen werden. Muster mit einem kleineren Verhältnis werden nicht zurückgegeben. Der Standardwert ist 0,05. Um den Standardwert zu verwenden, geben Sie die Tilde ein: ~.

Beispiel: T | evaluate basket(0.02)
WeightColumn string Der Spaltenname, der verwendet werden soll, um jede Zeile in der Eingabe gemäß der angegebenen Gewichtung zu berücksichtigen. Muss ein Name einer numerischen Typspalte sein, zint. B. , long. real Standardmäßig weist jede Zeile eine Gewichtung von 1 auf. Um den Standardwert zu verwenden, geben Sie die Tilde ein: ~. Eine übliche Nutzung einer Gewichtungsspalte besteht darin, die Stichprobenerstellung oder die Bucket-Zuordnung/Aggregation der Daten zu berücksichtigen, die bereits in die einzelnen Zeilen eingebettet sind.

Beispiel: T | evaluate basket('~', sample_Count)
MaxDimensions int Legt die maximale Anzahl nicht korrelierte Dimensionen pro Korb fest, die standardmäßig beschränkt ist, um die Abfragelaufzeit zu minimieren. Der Standard ist 5. Um den Standardwert zu verwenden, geben Sie die Tilde ein: ~.

Beispiel: T | evaluate basket('~', '~', 3)
CustomWildcard string Legt den Platzhalterwert für einen bestimmten Typ in der Ergebnistabelle fest, der angibt, dass das aktuelle Muster keine Einschränkung für diese Spalte besitzt. Der Standardwert ist null mit Ausnahme von Zeichenfolgenspalten, deren Standardwert eine leere Zeichenfolge ist. Wenn der Standardwert ein guter Wert in den Daten ist, sollte ein anderer Wildcardwert verwendet werden, z *. B. . Um den Standardwert zu verwenden, geben Sie die Tilde ein: ~.

Beispiel: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Hinweis

Um einen optionalen Parameter anzugeben, der auf einen optionalen Parameter folgt, stellen Sie sicher, dass Sie einen Wert für den vorherigen optionalen Parameter angeben. Weitere Informationen finden Sie unter Arbeiten mit optionalen Parametern.

Gibt zurück

Das basket Plug-In gibt häufige Muster zurück, die einen Schwellenwert für ein Verhältnis übergeben. Der Standardschwellenwert ist 0,05.

Jede Zeile in den Ergebnissen steht für ein Muster. Die erste Spalte ist die Segment-ID. Die nächsten beiden Spalten sind die Anzahl und der Prozentsatz der Zeilen aus der ursprünglichen Abfrage, die dem Muster entsprechen. Die verbleibenden Spalten beziehen sich auf die ursprüngliche Abfrage, wobei entweder ein bestimmter Wert aus der Spalte oder ein Wildcardwert, der standardmäßig NULL ist, was einen Variablenwert bedeutet.

Hinweis

Der Algorithmus verwendet Sampling, um die anfänglichen häufigen Werte zu bestimmen. Daher können sich die Ergebnisse leicht zwischen mehreren Läufen für Muster unterscheiden, deren Häufigkeit nahe am Schwellenwert liegt.

Beispiel

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Output

SegmentId Anzahl Percent State EventType Damage DamageCrops
0 4.574 77,7 NEIN 0
1 2278 38,7 Hagel NEIN 0
2 5.675 96,4 0
3 2371 40.3 Hagel 0
4 1279 21,7 Sturm 0
5 2468 41.9 Hagel
6 1310 22.3 JA
7 1.291 21,9 Sturm

Beispiel mit benutzerdefinierten Platzhaltern

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Output

SegmentId Anzahl Percent State EventType Damage DamageCrops
0 4.574 77,7 * * NEIN 0
1 2278 38,7 * Hagel NEIN 0
2 5.675 96,4 * * * 0
3 2371 40.3 * Hagel * 0
4 1279 21,7 * Sturm * 0
5 2468 41.9 * Hagel * -1
6 1310 22.3 * * JA -1
7 1.291 21,9 * Sturm * -1