Intelligent Recommendations Modellierung FAQ
Dieser Artikel bietet einen tieferen Einblick in die Typen von Modellierungsalgorithmen, die der Dienst Intelligent Recommendations verwendet, und gibt Antworten auf allgemeine Fragen zur Modellierung.
Inhalt
- Algorithmen Übersicht
-
Häufig gestellte Fragen
- Wie kann ich den Modellierungsstatus meiner Modelle nachverfolgen?
- Welchen Algorithmus und welchen Typ von Liste sollte ich für mein Unternehmen wählen?
- Wie sollte ich entscheiden, ob ich die Matrix-Faktorisierung oder den Direct Association-Algorithmus verwende?
- Wie viele Interaktionen brauche ich, um gute Empfehlungen zu erhalten?
- Warum brauche ich InteractionsGroupingId, UserId, ItemId und ItemVariantId in meiner Interactions Datenentität?
- Kann ich Element-Metadaten wie Kategorie, Farbe, Modell, etc. verwenden?
- Kann ich Benutzer-Metadaten, wie z.B. demografische Daten, verwenden, um Empfehlungen zu personalisieren?
- Kann ich Empfehlungen von Benutzer zu Benutzer machen?
- Wo kann ich mehr über das Modell der Matrix-Faktorisierung erfahren, das bei Intelligent Recommendations verwendet wird?
Übersicht über die Algorithmen der Intelligent Recommendations
Die Modellierung-Komponente für die Intelligent Recommendations verwendet einige verschiedene Algorithmen, um Ranglisten zu erstellen. Die Listen-API reagiert auf Abfragen und gibt je nach Typ des für die Modellierung ausgewählten Algorithmus Ergebnisse zurück. Weitere Informationen zu den Typen der vom Dienst Intelligent Recommendations verwendeten Algorithmen finden Sie in der folgenden Tabelle:
[!Hinweis]
Als bewährtes Verfahren sollten Sie mit Hilfe von Experimenten die Ergebnisse einiger verschiedener Listentypen und/oder Datentypen vergleichen, bevor Sie eine endgültige Entscheidung darüber treffen, welcher Algorithmus für Ihren Business Case und Ihr Dataset (das sowohl eine Kombination aus den Datentypen als auch dem tatsächlichen Verhalten ist) am besten geeignet ist.
Algorithmus Typ | Beschreibung |
---|---|
Matrix-Faktorisierung (MF) | Die Matrix-Faktorisierung ist ein Typ von kollaborativem Filteralgorithmus, der sich darauf konzentriert, Beziehungen zwischen Benutzern und Elementen auf der Grundlage spezifischer Benutzerinteraktionen (Kauf, Nutzung, Click-Through, Ansichten, Download usw.) zu erstellen. Bei diesem Algorithmustyp werden Ranglisten basierend auf den Verlaufspräferenzen eines bestimmten Benutzers erstellt, was wir als sein persönliches „Geschmacks“-basiertes Ranking bezeichnen. Außerdem werden Ähnlichkeiten zwischen Artikeln basierend auf den Interaktionen von Benutzern mit Artikeln abgeleitet. Die Matrix-Faktorisierung erzeugt symmetrische (wenn 'A' ähnlich wie 'B' ist, dann ist 'B' auch ähnlich wie 'A') und transitive (wenn 'A' ähnlich wie 'B' ist und 'B' ähnlich wie 'C' ist, dann ist 'A' ähnlich wie 'C') Rankings. Die besten Ergebnisse erzielen Sie mit dem Algorithmus-Typ Matrix-Faktorisierung, wenn Sie ein Dataset mit umfangreichen Interaktionssignalen und Katalog-Metadaten verwenden. Diese Funktion eignet sich hervorragend für Unterhaltungsbereiche wie Filme und Fernsehen, Spiele oder Streaming, funktioniert aber auch gut in anderen Bereichen, die auf Kundeninteraktionssignalen basieren, darunter: Einzelhandel, Lebensmittelgeschäft, Reiserouten, Fertigung und mehr. |
Direct Associated Similarities (DAS) (Direkt assoziierte Ähnlichkeiten) | Der Direct Associated Similarities (DAS)-Algorithmus eignet sich gut für Domänen mit lokaler/gezielter Affinität, in denen ein hoher Nutzen erforderlich ist, wie z.B. Apps, bei denen die Nützlichkeit wichtiger ist als die historische Präferenz (Geschmack). Zum Beispiel neigen Personen, die erst 'A', dann 'B' und dann 'C' tun, dazu, anschließend 'D' zu tun. DAS ist unsymmetrisch und nicht assoziativ. Unser Dienst nutzt den DAS-Algorithmus, um die Nächste Beste Aktion API zu betreiben, die Inhaltsvorschläge auf der Grundlage eindeutiger, wiederholbarer Gruppierungen erstellt. Eine allgemeine Anwendung der Nächsten Besten Aktion findet sich häufig im Einzelhandel bei der Vervollständigung von Warenkörben, wie z.B. „Häufig zusammen gekauft“, wo auf der Grundlage des Inhalts des Warenkorbs ergänzende Artikel vorgeschlagen werden. DAS kann auch Gruppen rekombinieren und Artikel aus verschiedenen Subdomains empfehlen. Einem Kunden, der in einem Lebensmittelgeschäft einkauft, können beispielsweise Servietten und Teller empfohlen werden, wenn er seine Burger-Patties und Brötchen in den Einkaufswagen legt. Zu den Domänen, die von der „Nächsten Besten Aktion“ profitieren, gehören Lebensmittel, Verkauf, Problembehandlung, Buchhaltung und mehr. |
Visual-Based Similarity (VBS) | Visual-Based Similarity (VBS) ist ein Algorithmus für Deep Learning und visuelle Wahrnehmung, der für ein bestimmtes Element visuell ähnliche Empfehlungen für Artikel mit ähnlichen Bildern liefert. Wie bei der Matrix-Faktorisierung sind auch die vom VBS-Algorithmus erzeugten Empfehlungen symmetrisch. Dieses neuronale Netzwerk mit Deep Learning und Faltung verwendet 'Argus' als Grundlage, wird jedoch mit tieferen Techniken auf die Bilder des Mandanten trainiert, so dass es viel relevantere Empfehlungen für die Domäne des Mandanten liefert. VBS ist unglaublich leistungsfähig in Domänen wie Mode, Design und Schmuck, wo visuelle Attribute ein wichtiger Bestandteil des Produkts sind. |
Text-Based Similarity (TBS) | Der Algorithmus Text-Based Similarity (TBS) liefert textuell ähnliche Empfehlungen für ein bestimmtes Seed Item, indem er ein Sprachmodell auf die Titel und Beschreibungen der Artikel im bereitgestellten Katalog fokussiert trainiert. Dieser Algorithmus funktioniert besonders gut in Domänen, in denen Titel und Beschreibungen beschreibend sind, und liefert einzigartige und intuitive Empfehlungen. Das Modell verwendet ein auf 'TNLR' Transformer basierendes Sprachmodell als Rückgrat. Das Modell verwendet jedoch auch Transfer Learning und tiefere Trainingstechniken auf dem bereitgestellten Dataset, was es diesem Algorithmus erlaubt, modernste Empfehlungen zu geben, die semantisch sinnvoll sind. TBS verwendet die Verarbeitung natürlicher Sprache (NLP) als Input, so dass dieser Algorithmus in vielen verschiedenen Domänen eingesetzt werden kann, z.B. bei Reiseplänen und Ausflügen, Weingütern, Datenbanken für wissenschaftliche Erfassungen, Problembehandlung und vielem mehr. |
Listen durchsuchen | Blätternlisten ermöglichen das Durchsuchen von Katalogen anhand von heuristisch basierten Diagrammen, die nach Informationen wie Gesamtumsatz, Summe der Klicks, Veröffentlichungsdatum oder einer Kombination verschiedener Kennzahlen sortiert sind. Die unterstützten Listen sind: 'Neu', 'Tendenz', 'Beliebt'. Charts sind ein hervorragender Ausgangspunkt, um Anwender schnell dazu zu bringen, mit Ihren Produkten zu interagieren und das Neueste und Beste aus Ihrem Produktkatalog zu sehen. Durchsuchen-Listen können durch Änderung des Typs der Eingabeinteraktion weiter verbessert werden. Zum Beispiel ein Modell basierend auf Kauf signalisiert „Beliebteste gekaufte Produkte“ zurückgeben, während sich die Modellsignale in Ansichten ändern, wird „Am häufigsten angesehene Produkte“ zurückgegeben. |
Häufig gestellte Fragen
Dieser Abschnitt behandelt eine Reihe von Fragen, die allgemein zu Modellen für Intelligent Recommendations und deren Anwendungen gestellt werden.
Wie kann ich den Modellierungsstatus nachverfolgen?
Kunden von Intelligent Recommendations können den Modellierungsstatus für jedes der Modelle nachverfolgen, die sie in ihrem Konto erstellt haben. Nachdem Sie ein Modell konfiguriert haben, erstellt der Dienst regelmäßig eine Statusprotokolldatei, um über den aktuellen Status aller Algorithmen (in Bezug auf Ihre Modellierungsebene) zu berichten. Um mehr über den Zugriff auf diese Protokolle zu erfahren, siehe Anleitung zur Modellierung von Statusberichten.
Welchen Algorithmus und welchen Typ von Liste sollte ich für mein Unternehmen verwenden?
Die Auswahl des Typs und des Algorithmus für die Liste hängt vom Anwendungsfall, der Erfahrung und den für die Modellierung verfügbaren Daten ab. Siehe Listennamen, AlgoTypes Tabelle, Verfeinerungen für eine vollständige Liste der verfügbaren Listennamen und AlgoType Kombinationen.
Im Allgemeinen spiegeln Modellierungsinteraktionen wider, womit Menschen interagieren. Wir beschreiben zum Beispiel den Listentyp „Personen auch“, der den MF-Algorithmus verwendet, als „Kunden, die diese Aktion machen, machen auch diese Aktion.“ Wenn die Aktion Kauf ist, wird die Liste zu „Personen, die das gekauft haben, haben auch gekauft.“
Element-Metadaten können auch verwendet werden, um Ähnlichkeiten zwischen Artikeln festzustellen, vorausgesetzt, die Metadaten sind in Umfang und Qualität ausreichend. So können beispielsweise Artikel mit ähnlichen Beschreibungen als eng verwandt betrachtet werden, genauso wie Artikel mit ähnlichen Produktbildern als eng verwandt gelten können. Diese Metadaten waren nützlich, um Ergebnisse für Elemente zu erstellen, bei denen möglicherweise keine Interaktionen verfügbar sind (auch als Modellierung „kalter Elemente“ bezeichnet).
Ansätze, die Interaktionen und Metadaten (für Artikel und/oder Benutzer) kombinieren, können mit Intelligent Recommendations verwendet werden, um die Szenarien und Erfahrungen anzupassen. Verwenden Sie mehrere verschiedene Modelle (und verwenden Sie ein Modell pro Konto), um zu experimentieren und zu sehen, welcher Ansatz für Ihre Anwendungsfälle am besten funktioniert.
Zuordnung der verfügbaren Typen von Daten und Anwendungsfällen zum Algorithmus-Typ
Verfügbarer Typ der Daten | Szenarien | Algorithmus |
---|---|---|
Interaktionen Z.B. Ansichten, Einkäufe, Nutzung usw. Was haben die Nutzer getan? |
Auswahlen für Sie kommissioniert Personalisierung Personen tun auch Nächste Beste Aktion |
Matrix-Faktorisierung (MF) Direkte Assoziation (DAS) |
Textuelle Metadaten z.B., Titel, Beschreibung |
Ähnliche Beschreibung | Textual Based Similarity (TBS) |
Visuelle Metadaten Z.B., Produktbilder aus mehreren Blickwinkeln |
Ähnliches Aussehen Hinweis: Nicht alle Domänen passen auf dieses Szenario. Sie sollten es in dem Fall verwenden, in dem Bilder eine gute Darstellung für ein Element sind. |
Visual-Based Similarity (VBS) |
Andere Element-Metadaten Z.B., Form, Kategorie, Tags, etc. |
Genau wie Interaktionen. Der Dienst lässt auch zu, dass Modelle auf unterschiedliche Weise erstellt werden: - Hybride Kombination von Element-Metadaten mit Interaktionen - Oder erstellt unter ausschließlicher Verwendung von Element-Metadaten (mit MF- oder DAS-Algorithmen) |
Matrix-Faktorisierung (MF) Direkte Assoziation (DAS) |
Benutzer-Metadaten Z.B., Demografische Daten |
Relevante Szenarien beziehen sich auf Benutzeranpassungen: - Auswahlen für Sie - Personalisierung Der Dienst lässt es zu, dass Modelle auf unterschiedliche Weise erstellt werden können: - In einer hybriden Form, die Benutzer-Metadaten mit Interaktionen kombiniert - Oder erstellt unter ausschließlicher Verwendung von Benutzer-Metadaten (mit MF- oder DAS-Algorithmen) |
Matrix-Faktorisierung (MF) Direkte Assoziation (DAS) |
Wie sollte ich entscheiden, ob ich die Matrix-Faktorisierung oder die Direct Association-Algorithmen verwende?
Es wird empfohlen, beide Algorithmen mit Ihren Daten auszuprobieren, um zu sehen, welcher Algorithmus die geeigneteren Ergebnisse für Ihre Geschäftsanforderungen liefert.
Versuchen Sie den Algorithmus der Matrix-Faktorisierung (MF), wenn:
- Die Verbindung zwischen Elementen in Ihrer Domäne ist meist kommutativ (symmetrisch, d. h., wenn A=>B dann B=>A) und assoziativ (d. h., wenn A=>B und B=>C dann A=>B).
- Ihre Daten sind spärlich verteilt, und Sie möchten trotzdem genügend Empfehlungen für viele Artikel.
Versuchen Sie den Direct Association-Algorithmus (DAS), wenn:
- Die Verbindung zwischen Elementen in Ihrer Domäne ist meist direktiv (asymmetrisch, d. h. A=>B bedeutet nicht B=>A) und direkt (nicht assoziativ).
- 'Nächste Beste Aktion' (bei einer geordneten Liste von Elementen, was sollte das nächste Element sein) ist ein wichtiges Szenario für Sie.
- Sie möchten eine Subdomain Ihrer Artikel einer anderen empfehlen.
- Direkte Verbindungen, die häufiger vorkommen, sollten in den Ergebnissen stärker berücksichtigt werden.
Weitere Informationen finden Sie unter Listennamen, AlgoTypes-Tabellen, Verfeinerungen.
Wie viele Interaktionen brauche ich, um gute Empfehlungen zu erhalten?
Um einen Damian für eine Reihe wichtiger Produkte richtig zu modellieren, sollte jedes Produkt mindestens fünf Interaktionen oder mehr für Szenarien wie „Personen mögen auch“ oder „Kommissionierungen“ (Personalisierung) enthalten. Sie bräuchten auch genügend Interaktionen, die mehr als ein Produkt umfassen, gruppiert nach der InteractionGroupingId (jeder Artikel in der gleichen Reihenfolge hätte eine Zeile in der Entität Interactions mit der gleichen InteractionGroupingId
), um Ergebnisse für „Next Best Action“ zu generieren.
Eine gute Faustregel ist, dass die Anzahl der Interaktionen etwa fünfmal so groß sein sollte wie die Anzahl der Artikel. Wenn z. B. 1.000 Artikel im Katalog vorhanden sind, wäre es gut, eine Modellierung mit mindestens 5.000 Interaktionen zu versuchen.
Im Zweifelsfall hilft es, es mit einem einfachen Modell (weniger Spalten) und möglichst vielen Interaktionen (mehr Zeilen) im Input Dataset auszuprobieren. Um die Qualität Ihres Datenvertrags zu bewerten und Metriken zur Leistung des Modells zu sehen, siehe Intelligente Empfehlungen Dashboards.
Warum brauche ich InteractionGroupingId, UserId, ItemId und ItemVariantId in meiner Entität für Interaktionsdaten?
InteractionGroupingId
steht für die mit dem System verbundenen Gruppen, insbesondere für Artikel, um eine bessere allgemeine Schlussfolgerung zu ermöglichen. Die Gruppierung von Transaktionen nach InteractionGroupingId im Einzelhandelsszenario kann dem System beispielsweise dabei helfen, die Produkte zu erkennen, die in einem Warenkorb „Häufig zusammen gekauft“ werden, oder Aufgaben, die in einer Rolle für „Next Best Action“ erledigt werden, oder ähnliche Artikel in „People also like“.
UserId
wird vom System verwendet, um die zwischen Elementen und Benutzern, die mit Elementen interagieren, gebildete Beziehungen zu modellieren, die je nach Fokus des Modells sowohl personalisierte als auch nicht personalisierte Modellierungsszenarien erstellen kann. Beim personalisierten Ansatz mit UserId modelliert das System eine Zuordnung zwischen Benutzern und Artikeln, basierend auf den historischen Präferenzen jedes einzelnen Benutzers. Anschließend wird das Modell „basierend auf Ihrer bisherigen Geschichte, die Ihnen gefallen könnte“ erstellt, das als „Picks for you“ bezeichnet wird.
ItemId
ist die eigentliche Referenz des Elements. Es ist wichtig, jedes Element mit seinen Interaktionen zu verbinden und zuzulassen, dass sich die Muster im Modell herausbilden. ItemIds, die keine Interaktionen haben, erscheinen nicht in Empfehlungen für andere Produkte und können auch unter schlechten Empfehlungen leiden, wenn sie als Ausgangspunkt für Modellierungen wie „Personen, die diesen Artikel mögen, mögen auch“ verwendet werden.
ItemVariantId
wird hauptsächlich für das Szenario „Ähnliches Aussehen“ und den Algorithmus Visual Based Similarity (VBS) verwendet, der anstelle von Interaktionen Bildmetadaten berücksichtigt. Dieses Feld ist für Modellierungen und Algorithmen, die auf Interaktionen beruhen, nicht erforderlich.
Weitere Informationen über die erforderlichen Entitäten pro Szenario finden Sie unter Tabelle für die Zuordnung von Entitäten.
Kann ich Artikel-Metadaten wie Kategorie, Farbe, Modell usw. verwenden?
Element-Metadaten können in vielerlei Hinsicht hilfreich sein:
- Die bessere Modellierung von Artikeln zusätzlich zur Eingabe von Interaktionen, sodass Artikel mit wenigen oder gar keinen Interaktionen (kalte Artikel) dennoch „Andere mögen auch“-Empfehlungen erhalten können.
- Es ist möglich, ein Modell zu erstellen, das vollständig auf den Metadaten der Artikel (z.B. Inhalts-Tags) basiert und als Ergebnis einen Typ von Empfehlungen „ähnliche Artikel“ liefert.
- Wie man das macht: Geben Sie dem Element der Metadaten eine TagId. Legen Sie in der Datenentität Interaktionen für jede Interaktionszeile die InteractionGroupingId als TagId fest, während Sie den Artikel als ItemId und den Benutzer als UserID beibehalten. Mehr über die Funktionsweise von TagIds erfahren Sie unter Anleitung zu Metadaten-Tagging und Bucketing.
[!WICHTIGER HINWEIS]
Verwenden Sie ein separates Konto für das auf Element-Metadaten basierende Modell, so dass Sie 1 IR-Modell pro IR-Konto haben und diese von dem auf reinen Benutzerinteraktionen basierenden Modell/Konto getrennt sind.
- Artikel mit informativen textuellen Beschreibungen können „Ähnliche Beschreibung“-Empfehlungen erhalten, modellbasiert durch unser NLP Deep Learning Modell.
- Artikel und Varianten mit Bildern können „Ähnlich aussehen“-Empfehlungen erhalten, modellbasiert durch unser Visual Cognition Deep Learning Modell.
Kann ich Benutzer-Metadaten, wie z.B. demografische Daten, verwenden, um Empfehlungen zu personalisieren?
Der Dienst Intelligent Recommendations lässt es zu, dass Kunden über einen Prozess des Metadaten-Tagging Benutzer-Metadaten einfügen. Benutzer-Metadaten können sehr hilfreich sein, um allen Benutzern relevante Inhalte zu empfehlen, einschließlich
- Neue oder seltene Kunden (auch bekannt als „kalte Benutzer“).
- Verbindung von Benutzern mit allgemeinen Attributen mit Metadaten-Tagging. Um mehr über die demografische Gruppierung mit Empfehlungen zu erfahren und Beispiele zu sehen, siehe Anleitung zu Metadaten-Tagging und Gruppierung.
Kann ich Empfehlungen von Benutzer zu Benutzer machen?
Momentan werden vollständige Empfehlungen von Benutzer zu Benutzer nicht unterstützt. Im Moment ist es für einige Datasets möglich, Benutzer-zu-Benutzer-Empfehlungen zu erhalten, indem Sie einige Änderungen am Datenvertrag vornehmen:
- Konstruieren Sie für jede ursprüngliche Interaktions-Eingabe jede Zeile zu:
- ItemID in die Spalte InteractionGroupingId schreiben
- Schreiben Sie UserID in die Spalte ItemId
- Stellen Sie die API-Anfrage: Nachdem Sie die vorherigen Änderungen am Datenvertrag vorgenommen haben, wird der Typ der Liste „Personen auch“ mit der UserId aufgerufen und gibt eine Liste ähnlicher Personen zurück.
Wo erfahre ich mehr über das Modell der Matrix-Faktorisierung, das bei Intelligent Recommendations verwendet wird?
Unser MF-Modell: Einklassiges kollaboratives Filtern mit zufälligen Graphen. Wir haben eine hauseigene Version der Bayes'schen Matrix-Faktorisierung entwickelt, die wir hier beschrieben haben und die zum Lernen beliebiger Einbettungen verwendet werden kann, wie wir hier erklärt haben.
Siehe auch
Anleitung zur Problembehandlung
API-Statuscodes
Datenvertrag
Datenentitäten Zuordnungstabelle.
Anleitung zu Metadaten-Tagging und Bucket.