Condividi tramite


innerunique join

Si applica a: ✅Microsoft Fabric✅Azure Esplora dati Azure MonitorMicrosoft Sentinel

Il innerunique tipo di join rimuove le chiavi duplicate dal lato sinistro. Questo comportamento garantisce che l'output contenga una riga per ogni combinazione di tasti univoci sinistro e destro.

Per impostazione predefinita, il innerunique tipo di join viene usato se il kind parametro non è specificato. Questa implementazione predefinita è utile negli scenari di analisi dei log/traccia, in cui si intende correlare due eventi in base a un ID di correlazione condiviso. Consente di recuperare tutte le istanze del fenomeno ignorando i record di traccia duplicati che contribuiscono alla correlazione.

Diagramma che mostra il funzionamento del join.

Sintassi

LeftTable | join kind=innerunique [ Hints ] RightTable Conditions on

Altre informazioni sulle convenzioni di sintassi.

Parametri

Nome Digita Obbligatorio Descrizione
LeftTable string ✔️ Tabella sinistra o espressione tabulare, talvolta denominata tabella esterna, le cui righe devono essere unite. Indicata come $left.
Hint string Zero o più hint join separati da spazi sotto forma di Valore nome = che controllano il comportamento dell'operazione di corrispondenza di riga e del piano di esecuzione. Per altre informazioni, vedere Hint.
RightTable string ✔️ Tabella destra o espressione tabulare, talvolta denominata tabella interna, le cui righe devono essere unite. Indicata come $right.
Condizioni string ✔️ Determina la corrispondenza delle righe di LeftTable con le righe di RightTable. Se le colonne che si desidera associare hanno lo stesso nome in entrambe le tabelle, usare la sintassi ON ColumnName. In caso contrario, usare la sintassi ON $left.LeftColumn $right.==RightColumn. Per specificare più condizioni, è possibile usare la parola chiave "and" o separarle con virgole. Se si usano virgole, le condizioni vengono valutate usando l'operatore logico "and".

Suggerimento

Per ottenere prestazioni ottimali, se una tabella è sempre più piccola dell'altra, usarla come lato sinistro del join.

Hint

Nome dei parametri Valori Descrizione
hint.remote auto, left, localright Vedere Join tra cluster
hint.strategy=broadcast Specifica il modo in cui condividere il carico di query sui nodi del cluster. Vedere broadcast join
hint.shufflekey=<key> La shufflekey query condivide il carico delle query sui nodi del cluster, usando una chiave per partizionare i dati. Vedere query shuffle
hint.strategy=shuffle La shuffle query di strategia condivide il carico di query sui nodi del cluster, in cui ogni nodo elabora una partizione dei dati. Vedere query shuffle

Valori restituiti

Schema: tutte le colonne di entrambe le tabelle, incluse le chiavi corrispondenti.
Righe: tutte le righe deduplicate della tabella a sinistra che corrispondono alle righe della tabella destra.

Esempi

Usare il join interno predefinito

let X = datatable(Key:string, Value1:long)
[
    'a',1,
    'b',2,
    'b',3,
    'c',4
];
let Y = datatable(Key:string, Value2:long)
[
    'b',10,
    'c',20,
    'c',30,
    'd',40
];
X | join Y on Key

Output

Chiave Value1 Chiave1 Valore2
b 2 b 10
c 4 c 20
c 4 c 30

Nota

Le chiavi 'a' e 'd' non vengono visualizzate nell'output poiché non sono presenti chiavi corrispondenti su entrambi i lati destro e sinistro.

La query ha eseguito il join predefinito, ovvero un inner join dopo la deduplicazione del lato sinistro in base alla chiave di join. La deduplicazione mantiene solo il primo record. Il lato sinistro risultante del join dopo la deduplicazione è:

Chiave Value1
a 1
b 2
c 4

Due possibili output di innerunique join

Nota

Il sapore di innerunique join può produrre due possibili output e entrambi sono corretti. Nel primo output l'operatore di join ha selezionato in modo casuale la prima chiave visualizzata in t1, con valore "val1.1", e la ha associata con le chiavi t2. Nel secondo output l'operatore di join ha selezionato in modo casuale la seconda chiave visualizzata in t1, con valore "val1.2", e la ha associata con le chiavi t2.

let t1 = datatable(key: long, value: string)  
    [
    1, "val1.1",  
    1, "val1.2"  
];
let t2 = datatable(key: long, value: string)  
    [  
    1, "val1.3",
    1, "val1.4"  
];
t1
| join kind = innerunique
    t2
    on key

Output

key value key1 value1
1 val1.1 1 val1.3
1 val1.1 1 val1.4
let t1 = datatable(key: long, value: string)  
    [
    1, "val1.1",  
    1, "val1.2"  
];
let t2 = datatable(key: long, value: string)  
    [  
    1, "val1.3", 
    1, "val1.4"  
];
t1
| join kind = innerunique
    t2
    on key

Output

key value key1 value1
1 val1.2 1 val1.3
1 val1.2 1 val1.4
  • Kusto è ottimizzato per il push di filtri che si trovano dopo join, verso il lato appropriato del join, a destra o sinistra, quando possibile.
  • Il tipo usato è a volte innerunique e il filtro viene propagato al lato sinistro del join. Il sapore viene propagato automaticamente e le chiavi che si applicano a tale filtro vengono visualizzate nell'output.
  • Usare l'esempio precedente e aggiungere un filtro where value == "val1.2" . Fornisce il secondo risultato e non darà mai il primo risultato per i set di dati:
let t1 = datatable(key: long, value: string)  
    [
    1, "val1.1",  
    1, "val1.2"  
];
let t2 = datatable(key: long, value: string)  
    [  
    1, "val1.3", 
    1, "val1.4"  
];
t1
| join kind = innerunique
    t2
    on key
| where value == "val1.2"

Output

key value key1 value1
1 val1.2 1 val1.3
1 val1.2 1 val1.4

Ottenere attività di accesso estese

Ottenere le attività estese da login in cui alcune voci contrassegnano come inizio e fine di un'attività.

let Events = MyLogTable | where type=="Event" ;
Events
| where Name == "Start"
| project Name, City, ActivityId, StartTime=timestamp
| join (Events
    | where Name == "Stop"
        | project StopTime=timestamp, ActivityId)
    on ActivityId
| project City, ActivityId, StartTime, StopTime, Duration = StopTime - StartTime
let Events = MyLogTable | where type=="Event" ;
Events
| where Name == "Start"
| project Name, City, ActivityIdLeft = ActivityId, StartTime=timestamp
| join (Events
        | where Name == "Stop"
        | project StopTime=timestamp, ActivityIdRight = ActivityId)
    on $left.ActivityIdLeft == $right.ActivityIdRight
| project City, ActivityId, StartTime, StopTime, Duration = StopTime - StartTime