Delen via


Het Vaak samen gekocht-model configureren (preview)

Belangrijk

Een gedeelte van of alle functionaliteit is beschikbaar als onderdeel van een preview-release. De inhoud en functionaliteit zijn aan verandering onderhevig.

Nadat u het vaak-samen-gekocht-model hebt geïmplementeerd, kunt u het model configureren om inzichten te genereren over de gegevens die beschikbaar zijn in het lakehouse.

Vereisten

U hebt de machtiging Fabric-beheerder (Medewerker van werkruimte) nodig om Vaak samen gekocht te kunnen configureren.

Het model configureren om inzichten te genereren

Het notitieblok bestaat uit de volgende cellen die het verhaal vertellen van hoe gegevens worden verwerkt om de vereiste uitvoer te leveren.

Let op

De volgende cellen worden gebruikt in de specifieke aanbevolen volgorde. Als ze in een andere volgorde worden gebruikt, mislukt de notebook.

Stap 1. Importeer bibliotheken

Met deze stap importeert u de benodigde bibliotheken voor het notebook. U hoeft in deze stap geen wijzigingen aan te brengen.

Stap 2. Initialiseer spark-configuraties, logger en checkpointer

Met deze stap worden de spark-configuraties, logboeken en checkpointer-objecten geïnitialiseerd die worden gebruikt voor de uitvoering van het notebook.

U kunt de logger op twee verschillende manieren initialiseren:

  • Instellen om logboeken naar de celuitgangen van de notebook te schrijven. Dit gedrag is de standaardinstelling.

  • Instellen om logboeken naar een Microsoft Azure Application Insights-werkruimte te schrijven. Voor deze aanpak hebt u de verbindingsreeks van de Application Insights-werkruimte nodig. Het systeem genereert een uitvoerings-id en geeft deze vervolgens weer in de celuitvoer. U kunt de uitvoerings-id gebruiken om logboeken in de Application Insights-werkruimte op te vragen.

U kunt de checkpointer gebruiken om de Spark-implementatie te synchroniseren en om het mogelijk genereren van dubbele sleutels te voorkomen. U moet een pad opgeven dat u als werkmap wilt gebruiken. De naam van de variabele is checkpoint_dir. De map moet zich in de bestandensectie van het lakehouse bevinden, dat wil zeggen dat deze moet beginnen met "Files/".

Stap 3. Maak verbinding met lakehouse en lees invoertabellen

Deze stap maakt verbinding met Lakehouse en leest de invoertabellen die nodig zijn voor het model. U kunt de invoertabellen uit een van de volgende drie opties lezen:

  • Het vastgezette Lakehouse van de notebook dat de voorbeeldgegevens bevat. Deze optie is de standaardinstelling.

  • Lakehouses die zijn aangesloten op de notebook. U kunt het lakehouse selecteren in een vervolgkeuzemenu.

  • Nog een Lakehouse die niet op de notebook is aangesloten. U moet het volledige pad naar het Lakehouse opgeven.

Zie Invoergegevens voor Vaak samen gekocht voor meer informatie over invoertabellen.

Stap 4. Definieer analyseperioden voor het model

Met de notebook kunt u het model over meerdere tijdsperioden uitvoeren, waardoor u de seizoensinvloeden en veranderingen in klantgedrag, productportfolio en productpositionering in de loop van de tijd kunt vastleggen. U kunt de resultaten van verschillende tijdsperioden ook vergelijken met het kant-en-klare dashboard.

Gebruik de functie add_analysis_period om een ​​tijdsperiode te definiëren. Zorg ervoor dat u de analyseperioden definieert binnen de duur van de invoergegevens. De duur van de invoergegevens (tijdstempel van maximale en minimale transacties) wordt vastgelegd in de uitvoer van de cel. U kunt maximaal vijf tijdsperioden definiëren. De referentiesleutels voor de perioden worden opgeslagen in de tabel TimePeriods .

Stap 5. Bewerk invoergegevens voor

Bij deze stap worden de invoergegevensframes samengevoegd om een ​​POS-gegevensset te maken die door het model wordt gebruikt om de inzichten te genereren. U hoeft in deze stap geen wijzigingen aan te brengen.

De uitvoer van deze stap bevat de volgende dataframes:

  • purchases - Het POS-dataframe purchases bevat informatie over de aankopen die klanten doen, zoals id van de detailhandelsentiteit, product-id, bedrag van de productlijstprijs, hoeveelheid en timestamp van bezoek. U kunt dit dataframe maken door de tabellen Visit, ShopperSession, ShopperSessionTransaction en TransactionLineItem samen te voegen.

  • time_periods - Dit dataframe bevat de analyseperioden die u in de vorige stap definieert. U kunt deze perioden gebruiken om de gegevens te splitsen en het model op elke periode uit te voeren.

  • retail_entities - Dit dataframe bevat de id's van de detailhandelsentiteit en hun informatie. Een detailhandelsentiteit kan een individuele winkel of een detailhandelaar zijn. U kunt deze entiteiten gebruiken om het model op winkel- of detailhandelaarniveau uit te voeren.

Stap 6. Definieer modelparameters en voer het model uit

De volgende modelparameters kunnen worden ingesteld om de modelresultaten te verfijnen:

  • Parameternaam: min_itemset_frequency

    • Beschrijving: minimale aantal aankopen van itemsets (verzameling van twee samen gekochte producten) waarmee rekening moet worden gehouden bij de analyse van het model.

    • Waardetype: integer

    • Standaardwaarde: 3

    • Vereist : waar.

    • Toegestane waarden: >=1

  • Parameternaam: max_basket_size

    • Beschrijving: maximale aantal artikelen in één mandje. Als het aantal artikelen in het winkelmandje de standaardwaarde overschrijdt, wordt het winkelmandje afgekapt. Het product met de laagste omzet in de gegevensset wordt als eerste afgekapt.

    • Waardetype: integer

    • Standaardwaarde: 20

    • Vereist : waar.

    • Toegestane waarden: >=1

  • Parameternaam: chi_2_alpha

    • Beschrijving: statistische significantieparameter. Wordt gebruikt om te bepalen of een paar met elkaar verbonden producten betekenisvol en statistisch significant is. Als een paar producten minder scoort dan de parameterwaarde, worden ze gemarkeerd in het veld Chi2IsSignificant in de RuleAttributes-tabel.

    • Waardetype: drijvend

    • Vereist: onwaar

    • Standaardwaarde: 0,05 percentiel

    • Toegestane waardenbereik: 0-1

Bij uitvoering worden gegevens naar de uitvoertabellen geschreven. U hebt drie opties om te definiëren naar welk Lakehouse u wilt schrijven.

Stap 7. Maak Power BI-dashboardtabellen

In deze stap maakt u Power BI-dashboardtabellen. Vergelijkbaar met Verbinding maken met Lakehouse en de sectie met invoertabellen lezen, zijn er drie methoden om uitvoer naar Fabric te schrijven.

Nadat het maken van de Power BI-dashboardtabellen is voltooid , schrijft het systeem gegevens naar het lakehouse. Zie tabellen met uitvoergegevens voor meer informatie

Stap 8. Maak een weergave met alleen 'Uitstekende associatie'

'Uitstekende associatie' is een classificatie die een sterke en statistisch significante relatie tussen de producten suggereert op basis van de criteria die zijn vastgelegd in de SQL-code. 'Uitstekende associatie' is afgeleid van de kolom StrengthOfAssociation die wordt gevuld op basis van voorwaardelijke instructies in de SQL-code. Deze logica categoriseert de sterkte van de associatie tussen producten op basis van de waarden van de kolommen RuleQualityCategoryId en IsSignificant in de FBT-tabel.

'Uitstekende associatie' verwijst naar gevallen waarin RuleQualityCategoryId 2 is (wat kan duiden op een associatieregel van hoge kwaliteit) en IsSignificant 1 (wat erop zou kunnen wijzen dat het verband statistisch significant is).

Als IsSignificant 0 is, betekent dit dat, hoewel de regelcategorie als uitstekend kan worden beschouwd, de significantie mogelijk beperkt is vanwege onvoldoende gegevens.

In deze stap maakt u een weergave met alleen 'Uitstekende associatie'. Deze stap maakt de producten symmetrisch. Als Product1=A en Product2=B, moet u in wezen een symmetrische record maken als Product1=B en Product2=A. U moet A en B afzonderlijk opvragen.

Stap 9. Configureer parameters voor Power BI-dashboardtabellen

U kunt de parameter num_top_associated_products gebruiken om het aantal meest geassocieerde producten te configureren dat voor elk product wordt weergegeven in het Power BI-dashboard.

  • Beschrijving: - Maximale aantal gekoppelde producten voor elk product dat wordt weergegeven in het Power BI-dashboard. Retourneert topproducten die door het veld Combinatiepositie worden gesorteerd.

  • Waardetype - geheel getal

  • Vereist - onwaar

  • Standaardwaarde - 5

  • Toegestane waardenbereik: - 1-10

Stap 10. Maak weergaven

U kunt weergaven maken op basis van de eerdere informatie, waarbij u aankoopbedragen en aantallen berekent als weekgemiddelden.

Met deze stap worden gegevens gerepliceerd voor alle productcriteria/-groepen die u afzonderlijk wilt bekijken. U kunt deze stap voltooien door elke winkel/detailhandelaar, periode en valuta te rangschikken.

  • Alle artikelen (indien Vaak samen gekocht met een ander artikel)

  • 10 hoogste omzetten van Vaak samen gekocht (hoofd + Vaak samen gekocht)

  • 10 laagste omzetten van Vaak samen gekocht (hoofd + Vaak samen gekocht)

  • Hoogste omzet uit hoofdartikelen

  • Laagste omzet uit hoofdartikelen

De weergave vertegenwoordigt de hoofdartikelen (Product1) voor elke winkel/detailhandelaar, tijdsperiode, valuta en productcriteria met de wekelijkse omzet, hoeveelheid en de som van alle omzetten van producten die vaak samen worden gekocht.

Stap 11 - Maak een tabel die gebruikmaakt van het Power BI-dashboard

De tabel die u in deze laatste stap maakt, is direct bruikbaar zonder dat u andere Power BI-metingen of berekende kolommen hoeft te maken.

Er bestaan drie typen records volgens TableColproductGroupType:

  • Type=1: TableColproductGroup="Groep N" - Deze record vertegenwoordigt het hoofdartikel dat deel uitmaakt van de dashboardtabel Vaak samen gekocht.

  • Type=2: TableColproductGroup="Hoofdproduct" - Deze record vertegenwoordigt eveneens het hoofdartikel dat deel uitmaakt van de dashboardtabel Vaak samen gekocht als een andere record.

  • Type=3: TableColproductGroup="FBT-product" - Deze record vertegenwoordigt het gekoppelde artikel aan het hoofdproduct.

Nu hebt u het opschonen van gegevens voltooid en hebt u het Power BI-rapport gemaakt met de juiste filters met behulp van het notitieblok. U kunt dit rapport gebruiken om bruikbare inzichten af te leiden.