Modelowanie Intelligent Recommendations — Często zadawane pytania
W tym artykule przedstawiono głębsze spojrzenie na rodzaje algorytmów modelowania, z których korzysta usługa Intelligent Recommendations, oraz przedstawiono odpowiedzi na typowe pytania dotyczące modelowania.
Zawartość
- Omówienie algorytmów
-
Często zadawane pytania
- Jak śledzić stan modelowania moich modeli?
- Jaki algorytm i typ listy należy wybrać dla mojej działalności?
- Jak ustalić, czy użyć algorytmów factorization macierzy czy bezpośrednich skojarzenia?
- Ile interakcji jest potrzebnych do zapewnienia dobrych zaleceń?
- Dlaczego do encji danych interakcji potrzebne są identyfikatory InteractionsGroupingId, UserId, ItemId i ItemVariantId?
- Czy można używać metadanych elementów, takich jak Kategoria, kolor, model itp.?
- Czy w celu spersonalizowania rekomendacji można użyć metadanych użytkownika, takich jak demografia?
- Czy mogę wykonać zalecenia dla użytkowników?
- Gdzie mogę dowiedzieć się więcej o modelu factorization macierzy używanym w Intelligent Recommendations?
Omówienie algorytmów Intelligent Recommendations
Składnik modelowanie Intelligent Recommendations używa kilku różnych algorytmów do tworzenia list odbiorców. Interfejs API listy odpowiada na zapytania i zwraca wyniki w zależności od typu algorytmu wybranego do modelowania. Więcej informacji na temat typów algorytmów używanych przez usługę Intelligent Recommendations znajduje się w następującej tabeli:
[!Uwaga]
Jako najlepszą praktykę użyj Eksperymentowania, aby porównać wyniki z kilku różnych typów list lub typów danych przed dokonaniem ostatecznego wyboru, który algorytm jest najlepszy dla Twojego biznesowego przypadku użycia i/lub zestawu danych (który jest zarówno kombinacją typów danych, jak i rzeczywistego zachowania ).
Typ algorytmu | opis |
---|---|
Współczynnik macierzy (MF) | Faktoryzacja macierzowa to rodzaj algorytmu filtrowania opartego na współpracy, który koncentruje się na tworzeniu relacji użytkownik-element i element-element w oparciu o określone interakcje użytkownika (zakup, użycie, klikanie, wyświetlenia, pobieranie itp.). Ta klasyfikacja typów algorytmów opiera się na historycznych preferencjach użytkownika, dlatego nazywamy ją klasyfikacją opartą na „smaku”. Zawiera także podobieństwa między elementami w oparciu o interakcje użytkowników z elementami. Czynniki macierzy są generowane symetrycznie (jeśli 'A' jest podobne do "B", to "B" jest także podobny do "A"), a cykliczny (jeśli "A" jest podobny do "B", a "B" jest podobny do "C", wówczas "A" jest podobny do "C"). Aby uzyskać najlepsze wyniki, należy użyć typu algorytmu czynnika macierzy w przypadku używania dokumentu zestaw danych z istotnych sygnałymi interakcji i metadanymi katalogu. Ta funkcja jest doskonała do domen rozrywkowych, takich jak Filmy i telewizja, Gry lub Przesyłanie strumieniowe, ale działa dobrze w innych domenach, które korzystają z sygnałów interakcji z klientami, takich jak Handel detaliczny, Rezerwacja, Podróży, Produkcja i inne. |
Bezpośrednie podobieństwa skojarzone (DAS) | Algorytm algorytmu DAS (Direct Associated Similarities) jest dobrze przystosowany do lokalnych/bezpośrednich domen opartych na narzędziach, takich jak Aplikacje, gdzie przydatna jest ważniejsza niż preferencja historyczny (domenę). Na przykład osoby, które później wykonają akcje "A", "B" i "C", będą później wykonać akcje "D". DAS jest niesymetryczny i nie jest skojarzeniem. Nasza usługa korzysta z algorytmu DAS w celu zastosowania interfejsu API następnej akcji, który tworzy sugestie zawartości na podstawie różnych, powtarzalnych grupowania. Typowe zastosowania aplikacji Następna najlepsza akcja są często widoczne w detalicznych artykułach kontrolnych w scenariuszach "ukończenia koszyka", takich jak "Wypełnienie koszyka", takich jak "Często używane przez klientów" — sugestie dotyczące wskazówek dotyczących zawartości menu użytkownika. Może też rekomendować grupy i rekomendować elementy z różnych poddomen. Na przykład zaleca się, aby przechwycić sprzedawcę, który przechwycił magazyn, i ich zawartość. Domeny, które skorzystają z "Następnego najlepszego działania", to np. sprzedaż, rozwiązywanie problemów, księgowy i nie tylko. |
Podobieństwo oparte na języku visual (VBS) | Podobieństwo oparte na języku graficznym (VBS) to algorytm uczenia maszynowego, który zwraca wizualne podobne zalecenia dla elementów z podobnymi obrazami dla danego elementu. Podobnie jak w przypadku czynnika macierzy, zalecenia, które zostały z nich symetryczne, są symetryczne. To szkolenie jest oparte na technologii "Arbone" jako szkieletowej sieci, ale jest ona przeszkolony dalej przy użyciu głębszych technik obrazów dzierżawcy w celu wyświetlania invariwertora, dostarczając znacznie bardziej odpowiednich zaleceń dla domeny dzierżawcy. VBS jest niewiarygodnie wydajny w domenach, takich jak Dane projektowe, Projektowanie i Dane, gdzie atrybuty wizualne to główna część sprzedaży produktu. |
Podobieństwo oparte na języku tekstowym (TBS) | Algorytm TENS (Text Based Similarity) zwraca tekstowo podobne zalecenia dla danego elementu, dzięki skupieniu się na szkoleniem językowym na temat tytułów i opisów elementów w katalogu dostępnym. Ten algorytm działa szczególnie dobrze w domenach, w których tytuły i opisy są opisowe, tworząc unikatowe i intuicyjne zalecenia. Model używa modelu językowego opartego na języku TNLR jako szkieletu, jednak używa również technik szkoleniowych i szkoleniowych dotyczących transferu zestaw danych, co pozwala ten algorytm na dostarczenie najnowszego zalecenia, które mają sens. W celu przetwarzania języka naturalnego (NLP) (Natural Language Processing) używa się tego algorytmu jako narzędzia służącego do wprowadzania tego algorytmu w wielu różnych domenach, m.in.: odsłaniania i wyszukiwania osób, wyszukiwania i wyszukiwania. |
Przeglądaj listy | Listy przeglądania umożliwiają przeglądanie katalogu przy użyciu heurystycznych wykresów posortowanych według informacji, takich jak łączna sprzedaż, suma kliknięć, data wydania lub kombinacja różnych metryk. Obsługiwane listy to: "Nowe", "Trending", "Popularne". Wykresy to doskonałe miejsce na szybkie rozpoczęcie pracy z produktami przez użytkowników końcowych i zobaczenie najlepszego katalogu produktów. Można dalej przeglądać listy, zmieniając typ wejściowej interakcji. Na przykład model oparty na sygnałach zakupów zwraca „najpopularniejsze zakupione produkty”, a zmiana sygnałów modelu na widoki zwraca najpopularniejsze wyświetlane produkty. |
Często zadawane pytania
W tej sekcji o często zadawane pytania dotyczące modeli Intelligent Recommendations i ich aplikacji.
Jak śledzić stan moich modeli?
Inteligentne rekomendacje klientów mogą śledzić stan modelowania dla każdego z modeli utworzonych na ich klientach. Po skonfigurowaniu modelu usługa okresowo tworzy plik dziennika stanu, który będzie raportować aktualny stan wszystkich algorytmów (w odniesieniu do warstwy modelu). Więcej informacji na temat uzyskiwania dostępu do tych dzienników można znaleźć w Przewodniku po raportach o stanie modelu.
Jaki algorytm i typ listy należy wybrać dla mojej działalności?
Wybór typu listy i algorytmu do użycia zależy od sprawy, doświadczenia i danych dostępnych do modelowania. Zobacz w tabeli Nazwy list, Udoskonalenia i AlgoTypes pełną listę dostępnych nazw list i kombinacji AlgoType.
Ogólnie rzecz biorąc, interakcje z modelami odzwierciedlają interakcje osób. Na przykład opisano typ listy "Również osoby", który korzysta z algorytmu CISD, a "klienci, którzy wykonają to działanie, również wykonaj tę akcję". Podczas zakupu akcji lista staje się listą "Osoby, które kupią to, również kupili to".
Metadanych elementów można także używać do ustanawiania podobieństw między elementami, o tyle że metadane są wystarczające pod uwagę przy odpowiedniej ilości i jakości. Na przykład elementy z podobnymi opisami można uznać za blisko ze sobą powiązane, tak jak elementy z podobnymi obrazami produktów mogą być blisko ze sobą powiązane. Metadane były przydatne do tworzenia wyników dla elementów, dla których nie można korzystać z interakcji (nazywanych również modelowaniem „braków elementów”).
Podejścia łączące Interakcje i oparte na metadanych (dla przedmiotów i/lub użytkowników) mogą być stosowane z Intelligent Recommendations w celu dostosowania scenariuszy i doświadczeń. Użyj wielu różnych modeli (i użyj jednego modelu na konto), aby eksperymentować i zobaczyć, które podejście działa najlepiej dla twoich przypadków użycia.
Mapowanie dostępnych typów danych i użycie spraw na typ algorytmu
Dostępny typ danych | Scenariusze | Algorytm |
---|---|---|
Interakcje Np. Widoki, Zakupy, Użycie itp. Co zrobili użytkownicy? |
Wybrane dla Ciebie Personalizacja Ludzie również Następna najlepsza akcja |
Współczynnik macierzy (MF) Skojarzenie bezpośrednie (DAS) |
Metadane tekstowe Np. Tytuł i opis |
Podobny opis | Podobieństwo oparte na języku tekstowym (TBS) |
Metadane wizualne Np. obrazy produktów z wielu stron |
Podobne wygląda Uwaga: Nie wszystkie domeny pasują do tego scenariusza. Należy go używać w przypadku, gdy obrazy są dobrą reprezentacją elementu. |
Podobieństwo oparte na języku visual (VBS) |
Inne metadane pozycji Np. Kształt, Kategoria, Tagi itp. |
Takie same jak interakcje. Usługa umożliwia także tworzenie modeli na różne sposoby: — w pliku do łączenia metadanych elementów z interakcjami — lub zbudowany przy użyciu metadanych tylko dla elementów (z algorytmami TOS lub DAS) |
Współczynnik macierzy (MF) Skojarzenie bezpośrednie (DAS) |
Metadane użytkownika Np. Dane demograficzne |
Odpowiednie scenariusze dotyczyły personalizacji użytkownika: - Wybrane dla Ciebie - Personalizacja Usługa umożliwia także tworzenie modeli na różne sposoby: — w pliku do łączenia metadanych elementów z interakcjami — lub zbudowany przy użyciu metadanych tylko dla użytkownika (z algorytmami TOS lub DAS) |
Współczynnik macierzy (MF) Skojarzenie bezpośrednie (DAS) |
Jak ustalić, czy użyć algorytmów factorization macierzy czy bezpośrednich skojarzenia?
Zaleca się wypróbowanie obu z danymi, aby sprawdzić, które algorytmy zwracają bardziej odpowiednie wyniki, zgodnie z wymaganiami biznesowymi.
Wypróbuj algorytm faktoryzacji macierzy (MF), jeśli:
- Połączenie między elementami w domenie jest w większości wartością comigracyjną (symetryczną, czyli jeśli A=>B następnie B=>A) i skojarzenie (np. jeśli A=>B i B=>C następnie A=>B).
- Dane są już używane i nadal są poszukiwane zalecenia dotyczące wielu elementów.
Sprawdź algorytm bezpośredniego skojarzenia (DAS), jeśli:
- Połączenie między elementami w domenie to w większości dyrektywy (asymetryczne, czyli A=>B nie znaczy B=>A) ani bezpośrednie (bez skojarzenia).
- Ważnym dla Ciebie scenariuszem jest „Next Best Action” (dając uporządkowaną listę pozycji, jaka powinna być następna).
- Zaleca się zalecanie jednego poddomeny elementów w innej.
- Bezpośrednie połączenie, które wydaje się bardziej widoczne, powinno być bardziej widoczne w wynikach.
Więcej informacji można znaleźć w tabelach Nazwy list, Udoskonalenia i AlgoTypes .
Ile interakcji jest potrzebnych do zapewnienia dobrych zaleceń?
Aby poprawnie modelować damiana dla zestawu ważnych produktów, każdy produkt powinien zawierać co najmniej pięć lub więcej interakcji dla scenariuszy typu „Ludzie też lubią” lub „Typy” (personalizacja). Potrzebna byłaby również wystarczająca liczba interakcji obejmujących więcej niż jeden produkt, który jest pogrupowany według InteractionGroupingId (każdy element w tym samym zamówieniu miałby wiersz w encji danych Interactions z tym samym InteractionGroupingId
), aby wygenerować wyniki dla „Następnej najlepszej akcji”.
Dobrą regułą jest osiągnięcie około pięciu razy owej liczby interakcji jako liczby elementów. Np. jeśli w katalogu znajduje się 1000 elementów, dobrze jest spróbować modelować przy użyciu co najmniej 5000 interakcji.
W razie wątpliwości warto wypróbować go za pomocą prostego modelu (mniejszej liczby kolumn) i liczby interakcji (większej liczby wierszy) w zestaw danych wejściowych. Aby ocenić kontrakt dotyczący danych pod względem jakości i sprawdzić metryki dotyczące wydajności modelu, zobacz pulpity nawigacyjne Intelligent Recommendations.
Dlaczego do encji danych interakcji potrzebne są identyfikatory InteractionGroupingId, UserId, ItemId i ItemVariantId?
InteractionGroupingId
Wskazują na grupy połączone z systemem, zwłaszcza dla elementów, aby lepiej zrozumieć ogólny wpływ tej tablicy. Na przykład grupowanie transakcji według InteractionGroupingId w scenariuszu handlu detalicznego może pomóc systemowi dowiedzieć się, które produkty są „Często kupowane razem” w koszyku lub zadania, które są wykonywane w roli „Następna najlepsza akcja” lub podobne elementy w „Ludzie również jak".
UserId
służy w systemie do modelowania relacji elementów i użytkowników korzystających z elementów, które w zależności od sposobu skupienia modelu mogą tworzyć zarówno scenariusze spersonalizowanego, jak i nieosobistego modelowania. W podejściu spersonalizowanym z UserId system modeluje mapowanie między użytkownikami a przedmiotami na podstawie historycznych preferencji każdego użytkownika. Następnie tworzy model „na podstawie Twojej dotychczasowej historii, może Ci się spodobać”, zwany „Wybrane dla Ciebie”.
ItemId
to rzeczywiste odniesienie do pozycji. Niezbędne jest połączenie poszczególnych elementów z interakcjami i umożliwić pojawianie się wzorców w modelu. ItemIds, które nie mają interakcji, nie pojawią się w rekomendacjach dla innych produktów i mogą również ucierpieć z powodu nieodpowiednich rekomendacji, gdy zostaną użyte jako źródło dla modeli, takich jak „Ludzie, którzy lubią ten przedmiot, też go lubią”.
ItemVariantId
jest używany głównie w scenariuszu „Podobny wygląd” i algorytmie podobieństwa wizualnego (VBS), który bierze pod uwagę metadane obrazu zamiast interakcji. To pole nie jest wymagane w przypadku modeli i algorytmów opartych na interakcjach.
Aby dowiedzieć się więcej o wymaganych encji danych w scenariuszu, zobacz tabelę mapowania encji danych.
Czy można używać metadanych elementów, takich jak Kategoria, kolor, model itp.?
Metadane elementów mogą być pomocne na wiele sposobów:
- Służy do lepszego modelowania elementów oprócz danych wejściowych interakcji, dzięki czemu elementy z niewielką liczbą interakcji lub nawet bez interakcji (elementy zimne) mogą nadal otrzymywać rekomendacje „Ludzie też lubią”.
- Możliwe jest posiadanie modelu całkowicie opartego na metadanych elementu (takich jak tagi treści) i zwracanie rekomendacji typu „podobne elementy”.
- Jak to zrobić: nadaj pozycji metadanych TagId. W Interactions Data Entity dla każdego wiersza Interaction ustaw InteractionGroupingId jako TagId, zachowując element jako ItemId i użytkownika jako UserID. Aby dowiedzieć się więcej o tym, jak działają tagi, zapoznaj się z naszym przewodnikiem po tagowaniu metadanych i grupowaniu.
[!WAŻNA UWAGA]
Użyj oddzielnego konta dla modelu opartego na metadanych elementu, tak aby mieć 1 model IR na konto IR i są one oddzielone od modelu/konta opartego wyłącznie na interakcjach użytkownika.
- Przedmioty z informacyjnymi opisami tekstowymi mogą otrzymywać rekomendacje „Podobny opis”, oparte na naszym głębokim modelu NLP.
- Produkty i warianty z obrazami mogą otrzymywać rekomendacje „Podobny wygląd”, oparte na naszym modelu uczenia głębokiego poznania wizualnego.
Czy w celu spersonalizowania rekomendacji można użyć metadanych użytkownika, takich jak demografia?
Usługa Intelligent Recommendations umożliwia klientom dołączanie metadanych użytkownika podczas procesu oznaczania metadanych. Metadane użytkownika mogą umożliwiać zalecanie wszystkim użytkownikom odpowiednich treści, takich jak
- Nowi lub nowi klienci (nazywane również "użytkownikami niemętni").
- Łączenie użytkowników ze wspólnymi atrybutami za pomocą tagowania metadanych. Aby dowiedzieć się więcej o danych demograficznych dzięki zaleceniam i poznać przykłady, zobacz przewodnik dotyczący oznaczania i nabierania metadanych.
Czy mogę wykonać zalecenia dla użytkowników?
Obecnie nie są obsługiwane pełne zalecenia dla użytkowników. Na razie niektóre zestawy danych mogą otrzymać zalecenia dla użytkowników i wprowadzić zmiany w kontrakcie danych:
- Dla każdego oryginalnego wprowadzania danych wejściowych interakcji każdy wiersz należy utworzyć w sposób:
- Zapisz element ItemID w kolumnie InteractionGroupingId
- Wpisz UserID w kolumnie ItemId
- Wykonaj żądanie interfejsu API: po wprowadzeniu poprzednich zmian w kontrakcie dotyczącym danych typ listy „Ludzie też” zostanie wywołany z identyfikatorem użytkownika i zwróci listę podobnych użytkowników.
Gdzie mogę dowiedzieć się więcej o modelu factorization macierzy używanym w Intelligent Recommendations?
Nasz model MF: jednoklasowe wspólne filtrowanie z losowymi wykresami. Opracowaliśmy wewnętrzną wersję faktoryzacji macierzy Bayesa, którą opisaliśmy tutaj i może być użyty do nauczenia się wszelkich osadzeń, jak wyjaśniliśmy tutaj.
Zobacz też
Przewodnik rozwiązywania problemów
Kody stanu API
Kontaktu dot. danych
Tabela mapowania encji danych.
Przewodnik po tagowaniu i grupowaniu metadanych.