Condividi tramite


Configurare il modello Frequently Bought Together (anteprima)

Importante

Alcune o tutte queste funzionalità sono disponibili come parte di una versione di anteprima. Il contenuto e la funzionalità sono soggetti a modifiche.

Dopo aver distribuito senza errori Frequently Bought Together, dovrai configurare il modello per generare informazioni dettagliate sui dati disponibili nel lakehouse.

Prerequisiti

Per configurare Frequently Bought Together è necessaria l'autorizzazione Amministratore Fabric (Collaboratore area di lavoro).

Configurare il modello per generare informazioni dettagliate

Il notebook è costituito dalle seguenti celle che raccontano come i dati vengono elaborati per fornire l'output necessario.

Attenzione

Le seguenti celle sono utilizzate nella sequenza specifica consigliata. Se sono utilizzate in una sequenza diversa, il notebook non riesce.

Passaggio 1: Importare le librerie

Questo passaggio importa le librerie necessarie per il notebook. Non è necessario apportare alcuna modifica in questo passaggio.

Passaggio 2. Inizializzare le configurazioni Spark, il logger e il checkpointer

Questo passaggio inizializza le configurazioni Spark nonché gli oggetti logger e checkpointer utilizzati per l'esecuzione del notebook.

Puoi inizializzare il logger in due modi diversi:

  • Impostato per scrivere log sugli output delle celle del notebook. Questo è il comportamento predefinito.

  • Configura la scrittura dei log in un'area di lavoro di Microsoft Azure Application Insights. Per questo approccio, è necessaria la stringa_connessione dell'area di lavoro Application Insights. Il sistema genera un ID esecuzione e quindi lo mostra nell'output della cella. Puoi utilizzare l'ID esecuzione per eseguire query sui log nell'area di lavoro Application Insights.

Puoi utilizzare il checkpointer per sincronizzare l'implementazione di Spark ed evitare la potenziale generazione di chiavi duplicate. Devi fornire un percorso che prevedi di utilizzare come directory di lavoro. Il nome della variabile è checkpoint_dir. La directory deve trovarsi nella sezione file di Lakehouse, ovvero deve iniziare con "Files/".

Passaggio 3: Connettersi al lakehouse e leggere le tabelle di input

Questo passaggio esegue la connessione al lakehouse e legge le tabelle di input necessarie per il modello. Puoi leggere le tabelle di input da una delle tre opzioni seguenti:

  • Il lakehouse aggiunto del notebook, che contiene i dati di esempio. Questa opzione è quella predefinita.

  • Lakehouse connessi al notebook. Puoi selezionare il lakehouse da un menu a discesa.

  • Un altro lakehouse che non è connesso al notebook. Devi fornire il percorso completo al lakehouse.

Per dettagli sulle tabelle di input, vedi Dati di input per Frequently Bought Together.

Passaggio 4: Definisci i periodi di analisi per il modello

Il notebook ti consente di eseguire il modello su più periodi di tempo, il che può aiutarti ad acquisire la stagionalità e i cambiamenti nel comportamento dei clienti, nel portafoglio prodotti e nel posizionamento dei prodotti nel tempo. Puoi anche confrontare i risultati di periodi di tempo diversi utilizzando il dashboard predefinito.

Per definire un periodo di tempo, utilizza la funzione add_analysis_period. Assicurati di definire i periodi di analisi entro la durata dei dati di input. La durata dei dati di input (timeout delle transazioni max e min) viene registrata nell'output della cella. Puoi definire fino a cinque periodi di tempo. Le chiavi di riferimento dei periodi sono memorizzate nella tabella TimePeriods.

Passaggio 5: Preelaborare i dati di input

Questo passaggio unisce i dataframe di input per creare un set di dati POS, utilizzato dal modello per generare informazioni dettagliate. Non è necessario apportare alcuna modifica in questo passaggio.

L'output di questo passaggio include i seguenti frame di dati:

  • acquisti - Il dataframe POS acquisti contiene informazioni sugli acquisti effettuati dai clienti, ad esempio ID entità di vendita al dettaglio, ID prodotto, importo del prezzo di listino prodotto, quantità e timestamp della visita. Puoi creare questo dataframe unendo le tabelle Visit, ShopperSession, ShopperSessionTransaction e TransactionLineItem.

  • time_periods - Questo dataframe contiene i periodi di analisi definiti nel passaggio precedente. Puoi utilizzare questi periodi per suddividere i dati ed eseguire il modello su ciascun periodo.

  • retail_entities - questo dataframe contiene gli ID entità di vendita al dettaglio e le relative informazioni. Un'entità di vendita al dettaglio può essere un singolo punto vendita o un rivenditore. Puoi utilizzare queste entità per eseguire il modello a livello di punto vendita o rivenditore.

Passaggio 6. Definire i parametri del modello ed eseguire il modello

È possibile impostare i seguenti parametri del modello per ottimizzare i risultati del modello:

  • Nome del parametro: min_itemset_frequency

    • Descrizione: numero minimo di acquisti di set di articoli (raccolta di due prodotti acquistati insieme) da considerare nell'analisi del modello.

    • Tipo di valore: intero

    • Valore predefinito: 3

    • Obbligatorio: vero.

    • Valori ammessi: >=1

  • Nome del parametro: max_basket_size

    • Descrizione: numero massimo di articoli in un carrello. Se il numero di articoli nel carrello supera il valore predefinito, il carrello viene tagliato. Il prodotto con le vendite più basse nel set di dati viene tagliato per primo.

    • Tipo di valore: intero

    • Valore predefinito: 20

    • Obbligatorio: vero.

    • Valori ammessi: >=1

  • Nome del parametro: chi_2_alpha

    • Descrizione: parametro di significatività statistica. Utilizzato per determinare se una coppia di prodotti associati è significativa, anche a livello statistico. Se una coppia di prodotti ottiene un punteggio inferiore al valore del parametro, viene contrassegnata nel campo Chi2IsSignificant nella tabella RuleAttributes.

    • Tipo di valore: float

    • Obbligatorio: falso

    • Valore predefinito: 0,05 percentile

    • Intervallo di valori ammessi: 0-1

Al momento dell'esecuzione, i dati vengono scritti nelle tabelle di output. Hai tre opzioni per definire in quale lakehouse scrivere.

Passaggio 7: Creare tabelle della dashboard Power BI

In questo passaggio creerai tabelle della dashboard Power BI. Come nella sezione Connettersi al lakehouse e leggere le tabelle di input, esistono tre metodi per scrivere output in Fabric.

Dopo aver finito di creare le tabelle della dashboard Power BI, il sistema scrive i dati nel lakehouse. Per altre informazioni, vedi le tabelle di dati output

Passaggio 8: creare una visualizzazione solo con "Associazione eccellente"

"Associazione eccellente" è una classificazione che suggerisce una relazione solida e statisticamente significativa tra i prodotti in base ai criteri stabiliti nel codice SQL. "Associazione eccellente" deriva dalla colonna StrengthOfAssociation che viene popolata in base alle istruzioni condizionali nel codice SQL. Questa logica classifica la forza dell'associazione tra i prodotti in base ai valori delle colonne RuleQualityCategoryId e IsSignificant nella tabella FBT.

"Associazione eccellente" si riferisce ai casi in cui RuleQualityCategoryId è 2 (che potrebbe indicare una regola di associazione di alta qualità) e IsSignificant è 1 (che potrebbe indicare che l'associazione è statisticamente significativa).

Se IsSignificant è 0, significa che sebbene la categoria della regola possa essere considerata eccellente, la significatività potrebbe essere limitata a causa di dati insufficienti.

In questo passaggio, crei una visualizzazione solo con "Associazione eccellente". Questo passaggio rende i prodotti simmetrici. In sostanza, se Prodotto1=A e Prodotto2=B, è necessario creare un record simmetrico come Prodotto1=B e Prodotto2=A. È consigliabile eseguire le query A e B separatamente.

Passaggio 9: parametri della tabella dashboard Power BI

Puoi utilizzare il parametro num_top_associated_products per configurare il numero dei migliori prodotti associati da visualizzare nella dashboard di Power BI per ciascun prodotto.

  • Descrizione - numero massimo di prodotti associati per ciascun prodotto da mostrare nel dashboard Power BI. Restituisce i migliori prodotti ordinati dal campo Classificazione combinazioni.

  • Tipo di valore: intero

  • Obbligatorio: falso

  • Valore predefinito: 5

  • Intervallo di valori ammessi: 1-10

Passaggio 10. Creare visualizzazioni

Puoi creare visualizzazioni dalle informazioni precedenti, in cui calcolare gli importi e le quantità di acquisto come medie settimanali.

Questo passaggio replica i dati per ciascun criterio/gruppo di prodotto che desideri visualizzare separatamente. Puoi completare questo passaggio classificando ciascun punto vendita/rivenditore, periodo di tempo e valuta.

  • Tutti gli articoli (se Spesso acquistati insieme è associato a un altro articolo)

  • 10 ricavi più alti per Spesso acquistati insieme (principale + Spesso acquistati insieme)

  • 10 ricavi più bassi per Spesso acquistati insieme (principale + Spesso acquistati insieme)

  • Il più venduto nei ricavi dell'articolo principale

  • Il meno venduto nei ricavi dell'articolo principale

La visualizzazione rappresenta gli articoli principali (Prodotto1) per ciascun punto vendita/rivenditore, periodo di tempo, valuta e criteri di prodotto con i ricavi settimanali, la quantità e la somma dei ricavi di tutti i prodotti acquistati frequentemente insieme.

Passaggio 11: creare una tabella utilizzata dalla dashboard di Power BI

La tabella creata in quest'ultimo passaggio è direttamente utilizzabile senza la necessità di creare altre misure o colonne calcolate di Power BI.

Esistono tre tipi di record in base a TableColProductGroupType:

  • Type=1: TableColProductGroup="Group N" - Questo record rappresenta l'articolo principale che fa parte della tabella della dashboard Spesso acquistati insieme.

  • Type=2: TableColProductGroup="Main product" - Questo record rappresenta anche l'articolo principale che fa parte della tabella della dashboard Spesso acquistati insieme come un altro record.

  • Type=3: TableColProductGroup="FBT product" - Questo record rappresenta l'articolo associato al prodotto principale.

Ora hai completato la pulizia dei dati e hai creato il report Power BI con opportuni filtri utilizzando il notebook. Puoi utilizzare questo report per ottenere informazioni dettagliate utili.