Dela via


Konfigurera modellen Köps ofta tillsammans (förhandsversion)

Viktigt

Några eller alla dessa funktioner ingår som en del av en förhandsversion. Innehållet och funktionerna kan komma att ändras.

När du har distribuerat modellen Köps ofta tillsammans måste du konfigurera den för att generera insikter om data som är tillgängliga i sjöhus.

Förutsättningar

Du måste ha behörighet som Fabric-administratör (Arbetsytedeltagare) att konfigurera Ofta tillsammans.

Konfigurera en modell för att skapa insikter

Notebook-filen består av följande celler som berättar hur data bearbetas för att ge önskade utdata.

Varning

Följande celler används i den specifika sekvens som rekommenderas. Om de används i en annan ordning kommer notebook-filen att misslyckas.

Steg 1. Importera bibliotek

Detta steg importerar de nödvändiga biblioteken för notebook-filen. Du behöver inte utföra några ändringar i detta steg.

Steg 2. Initiera gnistkonfigurationer, logg och checkpointer

Detta steg initierar gnistkonfigurationerna, logger- och checkpointerobjekten som används för körningen av notebook-filen.

Du kan initiera loggaren på två olika sätt:

  • Konfigurera för att skriva loggar till cellutmatningarna för notebook-filen. Detta beteende är standardbeteendet.

  • Konfigurera att skriva loggar till en Microsoft Azure Application Insights-arbetsyta. Med den här metoden behöver du anslutningssträngen för Application Insights-arbetsytan. Systemet genererar ett körnings-ID och visar det sedan i cellens utdata. Du kan använda körnings-ID:t för att ställa frågor till loggar på Application Insights-arbetsytan.

Du kan använda checkpointer för att synkronisera Spark-implementeringen och undvika potentiell generering av dubblettnycklar. Du måste ange en sökväg som du planerar att använda som arbetskatalog. Variabeln har namnet checkpoint_dir. Katalogen måste finnas i filavsnittet i sjöhuset, det vill säga att katalognamnet ska börja med "Filer/".

Steg 3. Anslut till sjöhuset och läs indatatabeller

Detta steg ansluter till Lakehouse och läser indatatabellerna som krävs för modellen. Du kan läsa indatatabellerna från något av följande tre alternativ:

  • Fäst sjöhuset i notebook-filen, som innehåller exempeldatan. Detta alternativ är standardinställningen.

  • Sjöhus som är kopplade till notebook-filen. Du kan välja sjöhuset på en listruta.

  • Ett annat sjöhus som inte är anslutet till notebook-filen. Du måste ange hela sökvägen till valt sjöhus.

För detaljer om indatatabeller, se Indata för Köps ofta tillsammans.

Steg 4. Definiera analysperioder för modellen

Med notebook-filen kan du köra modellen på flera tidsperioder, vilket kan hjälpa dig att registrera säsongsvariationer och förändringar i kundbeteende, produktportfölj och produktpositionering över tid. Du kan också jämföra resultaten för olika tidsperioder med hjälp av den färdiga instrumentpanelen.

För att definiera en tidsperiod, använd add_analysis_period-funktionen. Se till att definiera analysperioderna inom varaktigheten för indatan. Varaktigheten för indata (tidsstämpel för maximal och minimal transaktion) loggas i cellens utdata. Du kan definiera upp till fem tidsperioder. Referensnycklarna för perioderna lagras i tabellen Tidsperioder.

Steg 5. Förbearbeta indata

Detta steg förenar dataramarna för indata i syfte att skapa en datauppsättning för kassa, som används av modellen för att generera insikterna. Du behöver inte utföra några ändringar i detta steg.

I utdata från det här steget ingår följande dataramar:

  • inköp – Kassadataramen inköp innehåller information om inköpen som kunder gör, till exempel butiksentitets-ID, produkt-ID, prisbelopp i produktlista, kvantitet och besökets tidsstämpel. Du kan skapa den här dataramen genom att koppla ihop tabellerna Visit, ShopperSession, ShopperSessionTransaction och TransactionLineItem.

  • time_periods – Den här dataramen innehåller de analysperioder du definierar i föregående steg. Du kan använda perioderna för att dela upp data och köra modellen för respektive period.

  • retail_entities – Denna dataram innehåller entitets-ID:n för detaljhandel och deras information. En butiksentitet kan vara en enskild butik eller en återförsäljare. Du kan använda entiteterna för att köra modellen på butiks- eller återförsäljarnivå.

Steg 6. Definiera modellparametrar och kör modellen

Följande modellparametrar kan ställas in för att finjustera modellresultaten:

  • Parameternamn: min_itemset_frequency

    • Beskrivning: Minimalt antal köp av artikeluppsättningar (samling av två produkter köpta tillsammans) som ska beaktas i analysen av modellen.

    • Värdetyp: heltal

    • Standardvärde: 3

    • Erfordras: sann.

    • Tillåtna värden: >=1

  • Parameternamn: max_basket_size

    • Beskrivning: Maximalt antal varor i en och samma korg. Om antalet varor i korgen överstiger standardvärdet, trimmas korgen. Produkten med lägst försäljning i datauppsättningen trimmas först.

    • Värdetyp: heltal

    • Standardvärde: 20

    • Erfordras: sant.

    • Tillåtna värden: >=1

  • Parameternamn: chi_2_alpha

    • Beskrivning: Statistisk signifikansparameter. Används för att avgöra om ett par produkter som sammankopplas är meningsfulla och statistiskt signifikanta. Om ett par produkter får lägre poäng än parametervärdet flaggas de i fältet Chi2IsSignificant i tabellen RuleAttributes.

    • Värdetyp: flyttal

    • Erfordras: falskt

    • Standardvärde: 0,05 percentil

    • Tillåtet värdeintervall: 0-1

Vid körning skrivs data till utdatatabellerna. Du har tre alternativ för att definiera vilket Lakehouse du ska skriva till.

Steg 7: Skapa tabeller för Power BI-instrumentpanelen

I det här steget skapar du tabeller för Power BI-instrumentpanelen. Precis som för avsnittet Anslut till Lakehouse och läs avsnittet om inmatningstabeller finns det tre metoder för att skriva utdata till Fabric.

När du har skapat tabellerna för Power BI-instrumentpanelen skriver systemet data till sjöhuset. Mer information finns i utdatatabeller

Steg 8: Skapa en vy med enbart "Utmärkt association"

"Utmärkt association" är en klassificering som föreslår en stark och statistiskt betydelsefull relation mellan produkterna utifrån kriterierna i SQL-koden. "Utmärkt association" härleds från kolumnen StrengthOfAssociation som fylls i baserat på villkorliga uttryck i SQL-koden. Med den här logiken kategoriseras styrkan i associationen mellan produkter utifrån värdena i kolumnerna RuleQualityCategoryId och IsSignificant i KOT-tabellen.

"Utmärkt association" avser ärenden där RuleQualityCategoryId är 2 (som kan innebära en associationsregel med hög kvalitet) och IsSignificant är 1 (som kan tyda på att associationen är statistiskt betydelsefull).

Om IsSignificant är 0 betyder det att även om regelkategorin kan anses vara utmärkt, kan regeln begränsas på grund av bristande data.

I det här steget ska du skapa en vy med enbart "Utmärkt association". Det här steget gör produkterna symmetriska. Om Product1=A och Product2=B måste du skapa en symmetrisk post där Product1=B och Product2=A. Du bör fråga A och B separat.

Steg 9: Tabellparametrar för Power BI-instrumentpanelen

Du kan använda parametern num_top_associated_products för att konfigurera antalet associerade produkter som ska visas på Power BI-instrumentpanelen för varje produkt.

  • Beskrivning – Maximalt antal associerade produkter för varje produkt som ska visas på Power BI-instrumentpanelen. Returnerar de produkter som fältet Kombinationsrangordning sorterar.

  • Värdetyp: – heltal

  • Obligatoriskt – falskt

  • Standardvärde – 5

  • Tillåtet värdeintervall – 1-10

Steg 10: Skapa vyer

Du kan skapa vyer utifrån den tidigare informationen, där du beräknar inköpsbelopp och kvantiteter som genomsnitt per vecka.

I det här steget replikeras data för varje produktvillkor/grupp som du vill visa separat. Du kan utföra det här steget för varje butik/återförsäljare, tidsperiod och valuta.

  • Alla artiklar (om Köps ofta tillsammans gäller för en annan artikel)

  • 10 högsta intäkterna för Köps ofta tillsammans (huvudartikel + Köps ofta tillsammans)

  • 10 lägsta intäkterna för Köps ofta tillsammans (huvudartikel + Köps ofta tillsammans)

  • Mest sålda i omsättning för huvudartikel

  • Minst sålda i omsättning för huvudartikel

Vyn representerar huvudartiklar (Produkt1) för varje butik/återförsäljare, tidsperiod, valuta och produktvillkor med veckans omsättning, kvantitet och summa av alla intäkter för produkter som ofta köps tillsammans.

Steg 11: Skapa en tabell som Power BI-instrumentpanelen använder

Tabellen som du skapar i det här sista steget kan visas direkt utan att du behöver skapa andra Power BI-åtgärder eller beräknade kolumner.

Det finns tre typer av poster enligt TableColProductGroupType:

  • Typ=1: TableColProductGroup="Grupp N" – Den här posten representerar huvudartikeln som ingår i instrumentpanelstabellen för Köps ofta tillsammans.

  • Typ=2: TableColProductGroup="Huvudprodukt" – Den här posten representerar också huvudartikeln som ingår i instrumentpanelstabellen för Köps ofta tillsammans som en annan post.

  • Typ=3: TableColProductGroup="KOT-produkt" – Den här posten representerar artikeln som associeras med huvudprodukten.

Nu har du rensat alla data och skapat skapat Power BI-rapporten med lämpliga filter med hjälp av notebook-filen. Du kan använda den här rapporten när du vill härleda verkliga insikter .