Konfigurowanie modelu Często kupowane razem (wersja zapoznawcza)
Ważne
Niektóre lub wszystkie te funkcje są dostępne w wersji zapoznawczej. Zawartość i funkcjonalność mogą ulec zmianie.
Po pomyślnym wdrożeniu modułu Często kupowane razem trzeba skonfigurować model w celu generowania wiedzy o danych dostępnych w magazynie lakehouse.
Wymagania wstępne
Musisz mieć uprawnienie administratora Fabric (współautor obszaru roboczego) do konfiguracji razem często kupowanych razem.
Konfigurowanie modelu do generowania wglądu w dane
Notatnik składa się z następujących komórek, które opowiadają historię przetwarzania danych w celu zapewnienia wymaganych wyników.
Uwaga
Następujące komórki są używane w określonej zalecanej kolejności. Jeśli zostaną użyte w innej kolejności, notebook ulegnie awarii.
Krok 1. Importuj biblioteki
W tym kroku importowane są niezbędne biblioteki dla notesu. Nie masz żadnych zmian w tym kroku.
Krok 2. Zainicjuj konfiguracje Spark, rejestrator i punkt kontrolny
Ten krok inicjuje obiekty konfiguracji Spark, rejestratora i punktu kontrolnego, które są używane do wykonywania notesu.
Możesz inicjować program rejestrujący na dwa sposoby:
Skonfiguruj zapisywanie dzienników w wynikach komórek notatnika. To jest zachowanie domyślne.
Konfigurowanie zapisu dzienników do obszaru roboczego Microsoft Azure Application Insights. Do tego podejścia potrzebna jest connection_string obszaru roboczego Application Insights. System tworzy identyfikator uruchomienia, a następnie pokazuje go w danych wyjściowych komórki. Do zapytania dzienników w obszarze roboczym Application Insights można użyć identyfikatora uruchomienia.
Można użyć punktu kontrolnego do zsynchronizowania implementacji Spark oraz uniknięcia potencjalnej generowania zduplikowanych kluczy. Należy podać ścieżkę, która ma być używana jako katalog roboczy. Nazwą zmiennej jest checkpoint_dir. Katalog musi znajdować się w sekcji plików w magazynie lakehouse, czyli musi zaczynać się od „Files/”.
Krok 3. Połącz się z Lakehouse i przeczytaj tabele wejściowe
Ten krok łączy się z Lakehouse i odczytuje tabele wejściowe wymagane dla modelu. Tabele wejściowe można odczytać z jednej z następujących trzech opcji:
Przypięty Lakehouse notatnika, który zawiera przykładowe dane. Ta opcja jest domyślna.
Magazyny lakehouse, które są połączone z notesem. Z menu rozwijanego można wybrać magazyn lakehouse.
Inny Lakehouse, który nie jest podłączony do notatnika. Musisz podać pełną ścieżkę do Lakehouse.
Aby uzyskać szczegółowe informacje na temat tabel wejściowych, zobacz Dane wejściowe dla często kupowanych razem.
Krok 4. Definiowanie okresów analizy modelu
Notatnik umożliwia uruchomienie modelu w wielu okresach czasu, co może pomóc w uchwyceniu sezonowości i zmian w zachowaniach klientów, portfolio produktów i pozycjonowaniu produktów w czasie. Możesz także porównać wyniki z różnych okresów, korzystając z gotowego pulpitu nawigacyjnego.
Aby zdefiniować okres czasu należy skorzystać z funkcji add_analysis_period
. Pamiętaj, aby zdefiniować okresy analizy w ramach czasu trwania danych wejściowych. Czas trwania danych wejściowych (znacznik czasu transakcji maksymalnej i minimalnej) jest rejestrowany na wyjściu komórki. Można zdefiniować maksymalnie pięć okresów czasu. Klucze referencyjne dla okresów przechowywane są w tabeli TimePeriods.
Krok 5. Przetwarzaj wstępnie dane wejściowe
Ten krok łączy wejściowe ramki danych w celu utworzenia punktu sprzedaży zestaw danych, który jest używany przez model do generowania spostrzeżeń. Nie masz żadnych zmian w tym kroku.
Dane wyjściowe tego kroku obejmują następujące elementy dataframe:
zakupy — element danych punktu sprzedaży zakupu zawiera informacje na temat zakupu przez klientów, takie jak identyfikator obiektu detalicznego, identyfikator produktu, kwota ceny cennika produktu, ilość oraz identyfikator czasu wizyty. Ten ramki danych można utworzyć, dołączając do tabel Odwiedź, ShopperSession, ShopperSessionTransaction i TransactionLineItem.
time_periods — ten ramki danych zawiera okresy analizy definiujące w poprzednim kroku. Tych okresów można używać do dzielenia danych i uruchamiania modelu dla każdego okresu.
retail_entities — Ta ramka danych zawiera identyfikatory podmiotów detalicznych i ich informacje. Obiektem detalicznym może być pojedynczy magazyn lub sprzedawca detaliczny. Tych encji można używać do uruchamiania modelu na poziomie magazynu lub na poziomie sprzedawców detalicznych.
Krok 6. Zdefiniuj parametry modelu i wykonać model
Aby dostroić wyniki modelu, można ustawić następujące parametry modelu:
Nazwa parametru: min_itemset_frequency
Opis: Minimalna liczba zakupów zestawów pozycji (kolekcja dwóch produktów kupowanych razem) brana pod uwagę w analizie modelu.
Typ wartości: liczba całkowita
Wartość domyślna: 3
Wymagany: prawda.
Dozwolone wartości: >=1
Nazwa parametru: max_basket_size
Opis: Maksymalna liczba artykułów w jednym koszyku. Jeżeli ilość artykułów w koszyku przekracza wartość domyślną, koszyk zostaje przycięty. W pierwszej kolejności przycinany jest produkt z najniższą sprzedażą w zestaw danych.
Typ wartości: liczba całkowita
Wartość domyślna: 20
Wymagany: prawda.
Dozwolone wartości: >=1
Nazwa parametru: chi_2_alpha
Opis: Parametr istotności statystycznej. Służy do określenia, czy para powiązanych ze sobą produktów jest znacząca i istotna statystycznie. Jeśli para produktów uzyska wynik niższy niż wartość parametru, zostaną one oznaczone w polu Chi2IsSignificant w tabeli RuleAttributes.
Typ wartości: zmiennoprzecinkowa
Wymagany: fałsz
wartość domyślna 0.05 procenta
Dopuszczalny zakres wartości: 0-1
Po wykonaniu dane są zapisywane w tabelach wyjściowych. Masz trzy możliwości zdefiniowania, do którego Lakehouse chcesz pisać.
Krok 7: Tworzenie tabel pulpitów nawigacyjnych Power BI
W tym kroku należy utworzyć tabele pulpitu nawigacyjnego Power BI. Podobny do Połącz się z Lakehouse i przeczytaj sekcję z tabelami wejściowymi istnieją trzy metody zapisywania wyników w Fabric.
Po zakończeniu tworzenia tabel pulpitów nawigacyjnych Power BI system zapisuje dane w magazynie lakehouse. Aby uzyskać więcej szczegółów, zobacz artykuł dotyczący tabele danych wyjściowych
Krok 8: Tworzenie widoku tylko przy użyciu doskonałego skojarzenia
„Doskonałe skojarzenie” to klasyfikacja, która sugeruje silnym i istotnego z statystycznych relacji między produktami na podstawie kryteriów ustawionych w kodzie SQL. Doskonałe skojarzenie jest oparte na kolumnie StrengthOfAssoci, która jest wypełniana na podstawie instrukcji warunkowych w kodzie SQL. Ta logika skategoryzowała skojarzenie produktów na podstawie wartości kolumn RuleQualityCategoryId i IsSignificant z tabeli FBT.
„Doskonałe skojarzenie” odnosi się do spraw, w których RuleQualityCategoryId to 2 (co może oznaczać regułę skojarzenia o wysokiej jakości), a IsSignificant to 1 (co może wskazywać, że skojarzenie jest istotne w sposób statystyczny).
Jeśli IsSignificant jest 0, oznacza to, że kategoria reguły może być uważana za doskonałą, jednak mogą one być ograniczone z powodu braku wystarczających danych.
W tym kroku tworzysz widok tylko przy użyciu „doskonałego skojarzenia”. Ten krok powoduje, że produkty są symetryczne. W zasadzie, jeśli dla typu Produkt1=A i Produkt2=B konieczne jest utworzenie symetrycznego rekordu jako Produkt1=B i Produkt2=A. Należy zapytać o A i B oddzielnie.
Krok 9: Parametry tabelu pulpitu nawigacyjnego Power BI
Parametr num_top_associated_products umożliwia skonfigurowanie liczby skojarzonych produktów skojarzonych z najlepszymi produktami, które mają być wyświetlane na pulpicie nawigacyjnym Power BI dla każdego produktu.
Opis — Maksymalna liczba powiązanych produktów dla każdego produktu, która ma być pokazana w pulpicie nawigacyjnym Power BI. Zwraca pierwsze produkty sortowane w polu Klasyfikacja kombinacji.
Typ wartości — liczba całkowita
Wymagany — fałsz
Wartość domyślna — 5
Dopuszczalny zakres wartości — 1-10
Krok 10: Tworzenie widoków
Widoki można utworzyć na podstawie poprzednich informacji, w których kwoty zakupu i ilości są obliczane jako średnie tygodniowe.
Ten krok umożliwia replikowanie danych dla poszczególnych kryteriów/grup produktów, które mają zostać wyświetlić oddzielnie. Ten krok można zakończyć, korzystając z klasyfikacji poszczególnych magazynów/sprzedawców detalicznych, okresu i waluty.
Wszystkie elementy (jeśli często nie można chować się razem z innym elementem)
10 najwyższych wartości często zgłaszanych razem przychodów (główne + Często spotykane razem)
10 najniższych wartości często zgłaszanych razem przychodów (główne + Często spotykane razem)
Najlepsze sprzedawcy w przychodach z pozycji głównej
Najniżsi sprzedawcy w przychodach z pozycji głównej
Widok przedstawia główne elementy (Produkt1) dla każdego magazynu/sprzedawcy, okresu, waluty i kryteriów produktu wraz z jego tygodniowym przychodem, ilością i sumą często spotykanych przychodów produktów.
Krok 11: Tworzenie tabeli, która zużywa pulpit nawigacyjny Power BI
Tabela utworzyć w tym ostatnim kroku jest bezpośrednio indyjna bez konieczności tworzenia innych miar Power BI ani kolumn obliczanych.
Według typu TableColProductGroupType istnieją trzy typy rekordów:
Typ=1: TableColProductGroup="Grupa N" — ten rekord reprezentuje element główny, który jest częścią tabeli pulpitu nawigacyjnego często odwiedzanych razem.
Typ=2: TableColProductGroup="Główny produkt" — ten rekord także reprezentuje element główny, który jest częścią tabeli pulpitu nawigacyjnego często odwiedzanych razem jako inny rekord.
Typ=3: TableColProductGroup="Produkt FBT" — ten rekord reprezentuje element skojarzony z produktem głównym.
Po zakończeniu oczyszczania danych i utworzeniu raportu Power BI z zastosowaniem odpowiednich filtrów przy użyciu odpowiednich filtrów. Można go użyć do uzyskania wglądu w dane, które można wykorzystać do działania.