Konfigurace modelu Často kupované společně (Preview)

Článek
11/25/2024

Důležité

Některé nebo všechny tyto funkce jsou k dispozici jako součást vydání verze Preview. Obsah a funkce se mohou změnit.

Poté, co společně úspěšně nasadíte funkci Často kupované společně, musíte nakonfigurovat model tak, aby generoval přehledy o datech dostupných v transakčním jezeře.

Předpoklady

Ke společné konfiguraci často kupovaných potřebujete oprávnění správce Fabric (přispěvatel pracovního prostoru).

Konfigurace modelu pro vytváření přehledů

Poznámkový blok se skládá z následujících buněk, které vyprávějí příběh o tom, jak jsou data zpracovávána, aby poskytovala požadovaný výstup.

Upozornění

Následující buňky se používají ve specifickém doporučeném pořadí. Pokud jsou použity v jiném pořadí, poznámkový blok selže.

Krok 1. Import knihoven

Tento krok importuje potřebné knihovny pro poznámkový blok. V tomto kroku nemusíte dělat žádné změny.

Krok 2. Inicializace konfigurace spark, logger a checkpointer

Tento krok inicializuje objekty spark configs, logger a checkpointer, které se používají pro spuštění poznámkového bloku.

Logger můžete inicializovat dvěma různými způsoby:

Nastavte zápis protokolů do výstupů buněk poznámkového bloku. Toto chování je výchozí.
Nastavte zápis protokolů do pracovního prostoru Microsoft Azure Application Insights. Pro tento přístup potřebujete connection_string pracovního prostoru Application Insights. Systém vygeneruje ID běhu a poté je zobrazí ve výstupu buňky. ID běhu můžete použít k dotazování na protokoly v pracovním prostoru Application Insights.

Checkpointer můžete použít k synchronizaci implementace Spark a vyhnout se potenciálnímu generování duplicitních klíčů. Musíte zadat cestu, kterou plánujete použít jako pracovní adresář. Název proměnné je checkpoint_dir. Adresář musí být v sekci souborů Lakehouse, to znamená, že musí začínat „Files/“.

Krok 3. Připojte se k Lakehouse a čtěte vstupní tabulky

Tento krok se připojí k Lakehouse a načte vstupní tabulky, které jsou pro model vyžadovány. Vstupní tabulky můžete číst z jedné z následujících tří možností:

Připnutý Lakehouse poznámkového bloku, který obsahuje ukázková data. Tato možnost je výchozí.
Transakční jezera, která jsou připojena k poznámkovému bloku. Lakehouse můžete vybrat z rozbalovací nabídky.
Další Lakehouse, který není připojený k poznámkovému bloku. Musíte zadat úplnou cestu k Lakehouse.

Údaje o vstupních tabulkách viz Vstupní data pro Často nakupované společně.

Krok 4. Definování období analýzy pro model

Poznámkový blok vám umožňuje spouštět model ve více časových obdobích, což vám může pomoci zachytit sezónnost a změny v chování zákazníků, produktovém portfoliu a pozici produktů v průběhu času. Výsledky různých časových období můžete také porovnat pomocí připraveného řídicího panelu.

Chcete-li definovat časové období, použijte funkci add_analysis_period. Zajistěte definování období analýzy v rámci trvání vstupních dat. Doba trvání vstupních dat (maximální a minimální časové razítko transakcí) je zaznamenána do výstupu buňky. Můžete definovat až pět časových období. Referenční klíče pro období jsou uloženy v tabulce TimePeriods.

Krok 5. Předzpracování vstupních dat

Tento krok spojí vstupní datové rámce a vytvoří datovou sadu POS, kterou model používá ke generování přehledů. V tomto kroku nemusíte dělat žádné změny.

Výstup tohoto kroku obsahuje následující datové rámce:

purchases – Datový rámec POS purchases obsahuje informace o nákupech, které zákazníci provádějí, jako je ID maloobchodní jednotky, ID produktu, výše katalogové ceny produktu, množství a časové razítko návštěvy. Tento datový rámec můžete vytvořit připojením k tabulkám Visit, ShopperSession, ShopperSessionTransaction a TransactionLineItem.
time_periods – Tento datový rámec obsahuje období analýzy, které jste definovali v předchozím kroku. Tato období můžete použít k rozdělení dat a spuštění modelu pro každé období.
retail_entities – Tento datový rámec obsahuje ID maloobchodních entit a jejich informace. Maloobchodní jednotkou může být jednotlivá prodejna nebo maloobchodník. Tyto entity můžete použít ke spuštění modelu na úrovni prodejny nebo maloobchodu.

Krok 6. Definování parametrů modelu a spuštění modelu

Pro doladění výsledků modelu lze nastavit následující parametry modelu:

Název parametru: min_itemset_frequency
- Popis: Minimální počet nákupů sad položek (sbírka dvou produktů koupených společně), které je třeba vzít v úvahu při analýze modelu.
- Typ hodnoty: celé číslo
- Výchozí hodnota: 3
- Povinné : true.
- Povolené hodnoty: >=1
Název parametru: max_basket_size
- Popis: Maximální počet položek v jednom košíku. Pokud počet položek v košíku překročí výchozí hodnotu, košík se ořízne. Jako první se ořízne produkt s nejnižším prodejem v datové sadě.
- Typ hodnoty: celé číslo
- Výchozí hodnota: 20
- Povinné : true.
- Povolené hodnoty: >=1
Název parametru: chi_2_alpha
- Popis: Parametr statistické významnosti. Používá se k určení, zda je dvojice produktů spojených dohromady smysluplná a statisticky významná. Pokud má pár produktů skóre nižší než hodnota parametru, jsou označeny v poli Chi2IsSignificant v tabulce RuleAttributes.
- Typ hodnoty: plovoucí desetinná čárka
- Povinné: false
- Výchozí hodnota: 0,05 percentil
- Rozsah povolených hodnot: 0–1

Po spuštění jsou data zapsána do výstupních tabulek. Máte tři možnosti, jak definovat, do kterého Lakehouse chcete zapisovat.

Krok 7: Vytvoření tabulek řídicího panelu Power BI

V tomto kroku vytvoříte tabulky řídicího panelu Power BI. Podobně jako u části Připojení k Lakehouse a čtení vstupních tabulek existují tři způsoby zápisu výstupů do Fabric.

Po dokončení vytváření tabulek řídicího panelu Power BI systém zapíše data do Lakehouse. Další informace najdete v článku o výstupních datových tabulkách

Krok 8: Vytvořte pohled pouze s „výbornou asociací“

„Výborná asociace“ je klasifikace, která ukazuje na silný a statisticky významný vztah mezi produkty na základě kritérií stanovených v kódu SQL. „Výborná asociace“ je odvozena ze sloupce StrengthOfAssociation, který je vyplněn na základě podmíněných příkazů v kódu SQL. Tato logika kategorizuje sílu asociace mezi produkty na základě hodnot sloupců RuleQualityCategoryId a IsSignificant v tabulce FBT.

„Výborná asociace“ označuje případy, kdy RuleQualityCategoryId je 2 (což může znamenat vysoce kvalitní pravidlo asociace) a IsSignificant je 1 (což může znamenat, že asociace je statisticky významná).

Je-li IsSignificant 0, znamená to, že ačkoli může být kategorie pravidla považována za vynikající, významnost může být omezená kvůli nedostatečným datům.

V tomto kroku vytvořte pohled pouze s „výbornou asociací“. Tímto krokem jsou produkty symetrické. V zásadě platí, že pokud Product1=A a Product2=B, musíte vytvořit symetrický záznam jako Product1=B a Product2=A. A a B musíte dotazovat samostatně.

Krok 9: Parametry tabulky řídicího panelu Power BI

Pomocí parametru num_top_associated_products můžete nakonfigurovat počet nejčastěji přidružených produktů, které se mají zobrazit na řídicím panelu Power BI pro každý produkt.

Popis – maximální počet přidružených produktů pro každý produkt, který se zobrazí v řídicím panelu Power BI. Vrátí nejlepší produkty, které pole Pořadí kombinace řadí.
Typ hodnoty – celé číslo
Povinné – false
Výchozí hodnota – 5
Rozsah povolených hodnot – 1–10

Krok 10: Vytvoření zobrazení

Můžete vytvořit zobrazení z předchozích informací, kde vypočítáte nákupní částky a množství jako týdenní průměry.

Tento krok replikuje data pro každé kritérium / skupinu produktů, které chcete zobrazit samostatně. Tento krok můžete provést seřazením každého obchodu/maloobchodníka, časového období a měny.

Všechny položky (pokud často nakupujete společně s jinou položkou)
10 nejvyšších výnosů z často nakupovaných dohromady (hlavní + často nakupované společně)
10 nejnižších výnosů z často nakupovaných dohromady (hlavní + často nakupované společně)
Nejprodávanější v tržbách hlavní položky
Nejméně prodávané v tržbách hlavní položky

Zobrazení představuje hlavní položky (Product1) pro každý obchod/maloobchodníka, časové období, měnu a kritéria produktu s jejich týdenním výnosem, množstvím a součtem výnosů ze všech často nakupovaných produktů.

Krok 11: Vytvořte tabulku, kterou řídicí panel Power BI spotřebovává

Tabulka, kterou vytvoříte v tomto posledním kroku, je přímo použitelná bez nutnosti vytvářet další míry Power BI nebo počítané sloupce.

Podle TableColProductGroupType existují tři typy záznamů:

Type=1: TableColProductGroup="Group N" – Tento záznam představuje hlavní položku, která je součástí tabulky řídicího panelu Často kupované společně.
Type=2: TableColProductGroup="Main product" – Tento záznam také představuje hlavní položku, která je součástí tabulky řídicího panelu Často kupované společně jako další záznam.
Type=3: TableColProductGroup="FBT product" – Tento záznam představuje položku přidruženou k hlavnímu produktu.

Nyní jste dokončili čištění dat a vytvořili jste sestavu Power BI pomocí vhodných filtrů pomocí poznámkového bloku. Tato sestava slouží rovněž k odvození užitečných přehledů.

Sdílet prostřednictvím