Doporučovat skóre matchboxu
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- Podívejte se na informace o přesunu projektů strojového učení z ML Studia (klasického) do Azure Machine Learning.
- Další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Predikce skóre pro datovou sadu pomocí doporučovače Matchbox
Kategorie: Machine Learning / Skóre
Poznámka
Platí pro: Machine Learning Studio (classic)
Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.
Přehled modulu
Tento článek popisuje, jak pomocí modulu Doporučovací modul Score Matchbox v Machine Learning Studiu (klasickém) vytvořit předpovědi založené na vytrénovaném modelu doporučení na základě algoritmu Matchbox od Microsoft Research.
Doporučovač Matchboxu může generovat čtyři různé druhy předpovědí:
Při vytváření posledních tří druhů předpovědí můžete pracovat v produkčním režimu nebove zkušebním režimu.
Produkční režim bere v úvahu všechny uživatele nebo položky a obvykle se používá ve webové službě.
Můžete vytvářet skóre pro nové uživatele, nejen pro uživatele, kteří se viděli během trénování. Další informace najdete v této části.
Režim vyhodnocení funguje pro omezenou sadu uživatelů nebo položek, které lze vyhodnotit a obvykle se používají během experimentování.
Tip
V tomto kurzu od vývojového týmu pro .NET se dozvíte vše, co potřebujete vědět o všech zkušenostech při vytváření systému doporučení. Zahrnuje ukázkový kód a diskuzi o tom, jak volat Machine Learning z aplikace.
Vytváření modulu doporučení pro aplikace .NET pomocí Machine Learning
Další informace o doporučovači Matchboxu
Cílem vytvoření systému doporučení je doporučit uživatelům systému jednu nebo více "položek". Příkladem položky může být film, restaurace, kniha nebo skladba. Uživatel může být osoba, skupina osob nebo jiná entita s předvolbou položky.
Existují dva hlavní přístupy k doporučovacím systémům. Prvním je přístup založený na obsahu , který používá funkce pro uživatele i položky. Uživatele je možné popsat pomocí vlastností, jako je věk a pohlaví, a položky mohou být popsány vlastnostmi, jako je autor a výrobce. Typické příklady systémů doporučení založených na obsahu najdete na sociálních sítích. Druhým přístupem je filtrování založené na spolupráci, které používá pouze identifikátory uživatelů a položek a získává implicitní informace o těchto entitách z (zhuštěné) matice hodnocení zadaných uživateli pro položky. O uživateli se můžeme dozvědět víc z položek, které hodnotí, a od jiných uživatelů, kteří stejné položky hodnotí.
Doporučovací systém Matchbox kombinuje filtrování založené na spolupráci s přístupem založeným na obsahu. Proto se považuje za doporučovač hybridního využití. Pokud je uživatel v systému relativně nový, předpovědi se vylepšují použitím informací o funkci o uživateli a řeší tak známý problém "studeného startu". Jakmile je však k dispozici dostatečný počet hodnocení od konkrétního uživatele, je možné pro něj vytvořit plně přizpůsobené předpovědi na základě jejich konkrétních hodnocení, nikoli na základě jejich funkcí. Proto existuje hladký přechod od doporučení založených na obsahu k doporučením založeným na filtrování založeném na spolupráci. I když funkce uživatelů nebo položek nejsou k dispozici, matchbox stále funguje v režimu filtrování založeném na spolupráci.
Další podrobnosti o doporučovači Matchboxu a souvisejícím pravděpodobnostním algoritmu najdete v příslušném výzkumném dokumentu:
Příklady
Příklady vytváření skóre z modulu doporučení najdete v Azure AI Gallery.
Doporučovací: Doporučení k filmům: Tato ukázka ukazuje doporučení položky, kde položky jsou filmy, a také ukazuje predikci hodnocení.
Doporučovací: Hodnocení restaurace: Tato ukázka ukazuje doporučení položek pomocí funkcí položek i uživatelských funkcí.
- Recommendations Everywhere: Tento blogový příspěvek obsahuje základní úvod k doporučovacím systémům s mnoha vizuálními pomůckami.
Konfigurace doporučovat skóre matchboxu
Tento modul podporuje různé typy doporučení, z nichž každá má jiné požadavky. Klikněte na odkaz pro typ dat, která máte, a typ doporučení, které chcete vytvořit.
- Predikce hodnocení
- Doporučovat položky
- Vyhledání souvisejících uživatelů
- Vyhledání souvisejících položek
Predikce hodnocení
Při predikci hodnocení model vypočítá, jak bude daný uživatel reagovat na konkrétní položku s ohledem na trénovací data. Proto vstupní data pro bodování musí poskytnout ohodnotit uživatele i položku.
Přidejte k experimentu natrénovaný model doporučení a připojte ho k doporučovači Trained Matchbox. Model musíte vytvořit pomocí nástroje Train Matchbox Recommender.
Typ predikce doporučovateče: Vyberte Predikce hodnocení. Nejsou vyžadovány žádné další parametry.
Přidejte data, pro která chcete provádět předpovědi, a připojte je k datové sadě, abyste měli skóre.
Pokud chcete predikovat hodnocení, musí vstupní datová sada obsahovat páry uživatel-položka.
Datová sada může obsahovat volitelný třetí sloupec hodnocení pro dvojici uživatel-položka v prvním a druhém sloupci, ale třetí sloupec bude při predikci ignorován.
(Volitelné). Pokud máte datovou sadu uživatelských funkcí, připojte ji k uživatelským funkcím.
Datová sada uživatelských funkcí by měla v prvním sloupci obsahovat identifikátor uživatele. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují uživatele, například jejich pohlaví, předvolby, umístění atd.
Funkce uživatelů, kteří hodnotili položky, jsou doporučovacími funkcemi score matchbox ignorovány, protože se už naučili během trénování. Proto předem vyfiltrujte datovou sadu tak, aby zahrnovala pouze uživatele se studeným startem nebo uživatele, kteří žádné položky nezahrnou.
Upozornění
Pokud byl model vytrénován bez použití uživatelských funkcí, nemůžete během bodování zavést uživatelské funkce.
Pokud máte datovou sadu funkcí položek, můžete ji připojit k funkcím položky.
Datová sada funkcí položky musí v prvním sloupci obsahovat identifikátor položky. Zbývající sloupce by měly obsahovat hodnoty, které tyto položky charakterizují.
Doporučovací funkce hodnocených položek ignoruje doporučovací funkce score matchbox , protože se už naučily během trénování. Proto omezte svou hodnoticí datovou sadu na položky se studeným startem nebo na položky, které nebyly hodnoceny žádnými uživateli.
Upozornění
Pokud byl model vytrénován bez použití funkcí položek, nemůžete během bodování zavést funkce položek.
K odebrání položek, které už byly hodnoceny z výsledků předpovědi, použijte volitelný pátý vstupní port s názvem Trénovací datová sada.
Pokud chcete tento filtr použít, připojte ke vstupnímu portu původní trénovací datovou sadu.
Spusťte experiment.
Výsledky pro predikce hodnocení
Výstupní datová sada obsahuje tři sloupce, které obsahují uživatele, položku a předpokládané hodnocení pro každého vstupního uživatele a položku.
Během vyhodnocování se navíc použijí následující změny:
Chybějící hodnoty ve sloupcích funkcí uživatele nebo položky se automaticky nahradí režimem hodnot chybějících trénovací sady.
Všechny funkce uživatelů a položek se škáluje podle odpovídajícího maximálního počtu absolutních hodnot, které jsou vidět při trénování.
Na hodnoty funkcí se žádný překlad aplikuje, aby se zachovala jejich nesnáz.
Funkce s řetězcovou hodnotou se převádějí na sadu funkcí indikátoru s binární hodnotou.
Recommend
Pokud chcete uživatelům doporučovat položky, zadejte jako vstup seznam uživatelů a položek. Z těchto dat model využívá své znalosti o existujících položkách a uživatelích k vygenerování seznamu položek s předvídatelným odvoláním pro každého uživatele. Můžete přizpůsobit počet vrácených doporučení a nastavit prahovou hodnotu pro počet předchozích doporučení, která jsou vyžadována pro vygenerování doporučení.
Přidejte k experimentu školený model doporučení a připojte ho k škole Matchbox doporučení. Model je potřeba vytvořit pomocí nástroje pro školení Matchbox.
Chcete-li doporučit položky pro určitý seznam uživatelů, nastavte druh předpovědi doporučení na položku doporučení.
Doporučený výběr položky: Určete, jestli používáte modul bodování v produkčním prostředí, nebo pro vyhodnocení modelu volbou jedné z těchto hodnot:
Z hodnocených položek (pro vyhodnocení modelu): tuto možnost vyberte, pokud vyvíjíte nebo testujete model. Tato možnost povolí režim vyhodnocovánía modul vytváří doporučení pouze z těch položek ve vstupní datové sadě, které byly ohodnoceny.
Ze všech položek: tuto možnost vyberte, Pokud nastavujete experiment pro použití v rámci webové služby nebo výroby. Tato možnost umožňuje režim produkčníhoprostředí a modul dává doporučení ze všech položek, které se během školení zobrazily.
Přidejte datovou sadu, pro kterou chcete vytvořit předpovědi, a připojte ji k datové sadě ke skóre.
Zvolíte -li možnost, musíbýt vstupní datová sada tvořena jedním a pouze jedním sloupcem obsahujícím identifikátory uživatelů, pro které chcete doporučení vytvořit.
Pokud datová sada obsahuje více než jeden sloupec, je vyvolána chyba. Pomocí modulu Výběr sloupců v datové sadě můžete ze vstupní datové sady odebrat nadbytečné sloupce.
Pokud zvolíte možnost, od hodnocených položek (pro vyhodnocení modelu), vstupní datová sada by měla obsahovat páry uživatelských položek. První sloupec by měl obsahovat identifikátor uživatele . Druhý sloupec by měl obsahovat odpovídající identifikátory položek .
Datová sada může zahrnovat třetí sloupec hodnocení položky uživatele, ale tento sloupec je ignorován.
(Volitelné). Pokud máte datovou sadu uživatelských funkcí, připojte ji k uživatelským funkcím.
První sloupec v datové sadě uživatelských funkcí by měl obsahovat identifikátor uživatele. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují uživatele, například jejich pohlaví, předvolby, umístění atd.
Funkce pro uživatele, kteří mají hodnocené položky, se ignorují doporučeným nástrojem skore Matchbox, protože tyto funkce se už během školení dozvěděly. Proto můžete datovou sadu předem vyfiltrovat, aby zahrnovala pouze studené uživatelenebo uživatele, kteří nehodnotili žádné položky.
Upozornění
Pokud byl model vyškolený bez použití uživatelských funkcí, nelze při vyhodnocování použít funkci použít.
Volitelné Máte-li datovou sadu funkcí položky, můžete ji připojit k funkcím položek.
První sloupec v datové sadě funkcí položky musí obsahovat identifikátor položky. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují položky.
Funkce hodnocených položek se ignorují doporučeným nástrojem skore Matchbox, protože tyto funkce se už během školení dozvěděly. Proto můžete omezit datovou sadu bodování na položky pro studený startnebo položky, které nebyly ohodnoceny žádnými uživateli.
Upozornění
Pokud byl model vyškolený bez použití funkcí položky, při bodování nepoužívejte funkce položek.
Maximální počet položek, které je potřeba doporučit pro uživatele: zadejte počet položek, které se mají vrátit pro každého uživatele. Ve výchozím nastavení se doporučuje 5 položek.
Minimální velikost fondu doporučení na uživatele: zadejte hodnotu, která určuje, kolik předchozích doporučení je potřeba. Ve výchozím nastavení je tento parametr nastaven na hodnotu 2, což znamená, že položka musí být doporučena alespoň dvěma dalšími uživateli.
Tato možnost by se měla používat jenom v případě, že vyhodnocujete režim vyhodnocování. Možnost není k dispozici, pokud vyberete možnost ze všech položek.
Spusťte experiment.
Výsledky doporučení položky
Vyhodnocená datová sada vrácená funkcí skore Matchbox doporučuje doporučit seznam doporučených položek pro každého uživatele.
- První sloupec obsahuje identifikátory uživatelů.
- Vygeneruje se počet dalších sloupců v závislosti na hodnotě nastavené pro maximální počet položek, které se doporučují pro uživatele. Každý sloupec obsahuje doporučenou položku (podle identifikátoru). Doporučení jsou seřazená podle spřažení položek a uživatele, přičemž položka s největším spřažením je vložena do sloupce, Položka 1.
Upozornění
Tuto datovou sadu s hodnocením nejde vyhodnotit pomocí modulu vyhodnocení doporučení .
Najít související uživatele
Možnost najít související uživatele je užitečná, pokud doporučete "lidem, jako jste vy", nebo pokud vytváříte fond podobných uživatelů, na kterých chcete založit jiné typy předpovědi.
Přidejte k experimentu školený model doporučení a připojte ho k škole Matchbox doporučení. Model je potřeba vytvořit pomocí nástroje pro školení Matchbox.
Doporučený druh předpovědi: vyberte související uživatelé.
Výběr souvisejícího uživatele: uveďte, jak budete model používat pro bodování, a určete fond uživatelů, na kterých se mají založit skóre, a to následujícím způsobem:
Od všech uživatelů: tuto možnost vyberte, Pokud nastavujete experiment pro použití v rámci webové služby nebo výroby, nebo pokud potřebujete vytvořit předpovědi pro nové uživatele. Tato možnost povoluje provozní režima modul využívá doporučení pouze pro uživatele, kteří se zobrazili během školení.
Od uživatelů, kteří ohodnotili položky (pro vyhodnocení modelu): tuto možnost vyberte, pokud vyvíjíte nebo testujete model. Tato možnost povolí režim vyhodnocovánía model vychází z doporučení pro uživatele v sadě testů, kteří si vyhodnotili některé běžné položky.
Připojení datovou sadu obsahující uživatele, pro které se mají generovat předpovědi. Formát této datové sady závisí na tom, zda používáte modul bodování v provozním režimu nebo v režimu vyhodnocení.
Provozní režim pomocí ze všech položek
Datová sada pro skóre musí obsahovat uživatele , pro které chcete najít související uživatele. První a jenom sloupec by měl obsahovat identifikátory uživatelů. Pokud jsou zahrnuté jiné sloupce, vyvolá se chyba. K odebrání nepotřebných sloupců použijte modul Výběr sloupců v datové sadě .
Režim vyhodnocení pomocí z hodnocených položek (pro vyhodnocení modelu)
Datová sada pro skóre by měla sestávat z 2-3 sloupců, které obsahují páry uživatelských položek. První sloupec by měl obsahovat identifikátory uživatele. Druhý sloupec by měl obsahovat identifikátory položek. Datová sada může obsahovat třetí sloupec hodnocení (uživatel ve sloupci 1 pro položku ve sloupci 2), ale sloupec hodnocení se bude ignorovat.
Maximální počet souvisejících uživatelů, kteří se mají najít pro uživatele: zadejte číslo, které určuje maximální počet předpovědi pro každého uživatele. Výchozí hodnota je 5, což znamená, že je možné vrátit maximálně pět souvisejících uživatelů, ale v některých případech může být méně než 5.
V režimu vyhodnocování (od uživatelů s hodnocením položek) nakonfigurujte tyto další parametry:
Minimální počet položek, které musí uživatel s dotazem a související uživatel vyhodnocen jako společný: Tato hodnota Nastaví prahovou hodnotu pro doporučení. Číslo, které zadáte, představuje minimální počet položek, které musí být ohodnocené cílovým uživatelem a potenciálním souvisejícím uživatelem. Výchozí hodnota je 2, což znamená, že oba uživatelé musí být ohodnoceni minimálně dvěma položkami.
Minimální velikost souvisejícího fondu uživatelů pro jednoho uživatele: Tato hodnota řídí minimální počet podobných uživatelů potřebných k vytvoření doporučení. Ve výchozím nastavení je hodnota 2, což znamená, že pokud máte několik uživatelů, kteří souvisejí na základě hodnocení stejných položek, můžete je považovat za související a vygenerovat doporučení.
(Volitelné). Pokud máte datovou sadu uživatelských funkcí, připojte ji k uživatelským funkcím.
První sloupec v datové sadě uživatelských funkcí by měl obsahovat identifikátor uživatele. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují uživatele, například pohlaví, předvolby, umístění atd.
Funkce pro uživatele, kteří mají hodnocené položky, jsou ignorovány podle skóre Matchbox , protože tyto funkce již byly během školení zjištěny. Proto vyfiltrujte datovou sadu předem, aby zahrnovala pouze studené uživatelenebo uživatele, kteří nehodnotili žádné položky.
Upozornění
Pokud byl model vyškolený bez použití uživatelských funkcí, nelze během bodování použít uživatelské funkce.
Volitelné Pokud máte datovou sadu funkcí položky, připojte ji k funkcím položek.
První sloupec v datové sadě funkcí položky musí obsahovat identifikátor položky. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují položky.
Funkce hodnocených položek se ignorují podle skóre Matchbox , protože tyto funkce se už během školení dozvěděly. Proto můžete omezit datovou sadu bodování na položky pro studený startnebo položky, které nebyly ohodnoceny žádnými uživateli.
Upozornění
Pokud byl model vyškolený bez použití funkcí položky, při bodování nepoužívejte funkce položek.
Spusťte experiment.
Výsledky pro související uživatele
Vyhodnocená datová sada vrácená funkcí skore Matchbox doporučuje uživatelům, kteří souvisejí s jednotlivými uživateli ve vstupní datové sadě, použít seznam uživatelů.
Pro každého uživatele zadaného ve vstupní datové sadě obsahuje Výsledná sada dat sadu souvisejících uživatelů.
První sloupec obsahuje identifikátor cílového uživatele (uživatel zadal jako vstup).
Další sloupce jsou generovány obsahující identifikátory souvisejících uživatelů. Počet dalších sloupců závisí na hodnotě, kterou jste nastavili v možnosti, maximálnímu počtu souvisejících uživatelů, které se mají najít pro uživatele.
Vzdálení uživatelé jsou seřazeni podle síly vztahu k cílovému uživateli, který má nejvíce souvisejícího uživatele ve sloupci, souvisejícího uživatele 1.
Najít související položky
Předvídáním souvisejících položek můžete vygenerovat doporučení pro uživatele na základě položek, které již byly ohodnoceny.
Přidejte k experimentu školený model doporučení a připojte ho k škole Matchbox doporučení. Model je potřeba vytvořit pomocí nástroje pro školení Matchbox.
Druh předpovědi doporučenéhopro výběr: vyberte související položky.
Připojení datovou sadu obsahující uživatele, pro které se mají generovat předpovědi. Formát této datové sady závisí na tom, zda používáte modul bodování v provozním režimu nebo v režimu vyhodnocení.
Provozní režim pomocí ze všech položek
Datová sada pro skóre musí sestávat z položek, pro které chcete najít související uživatele.
První a jediný sloupec by měl obsahovat identifikátory položek. Pokud jsou zahrnuté jiné sloupce, vyvolá se chyba. K odebrání nepotřebných sloupců použijte modul Výběr sloupců v datové sadě .
Režim vyhodnocení pomocí z hodnocených položek (pro vyhodnocení modelu)
Datová sada pro skóre by měla sestávat z 2-3 sloupců, které obsahují páry uživatelských položek. První sloupec by měl obsahovat identifikátory uživatele. Druhý sloupec by měl obsahovat identifikátory položek.
Datová sada může obsahovat třetí sloupec hodnocení (uživatel ve sloupci 1 pro položku ve sloupci 2), ale sloupec hodnocení se ignoruje.
Maximální počet souvisejících položek, které se mají najít u položky> : zadejte číslo, které určuje maximální počet předpovědi pro každou položku.
Výchozí hodnota je 5, což znamená, že maximálně pět souvisejících položek může být vráceno, ale může být méně než 5.
Pokud používáte zkušební režim (od uživatelů s hodnocenými položkami), nakonfigurujte tyto další parametry:
Minimální počet položek, které položka dotazu a související položka musí být ohodnoceny běžným: Tato hodnota Nastaví prahovou hodnotu pro doporučení. Číslo, které zadáte, představuje minimální počet položek, které byly ohodnoceny cílovým uživatelem a nějakým souvisejícím uživatelem. Výchozí hodnota je 2, což znamená, že minimálně dvě položky musí být ohodnocené cílovým uživatelem a souvisejícím uživatelem.
Minimální velikost souvisejícího fondu položek pro jednu položku: Tato hodnota řídí minimální počet podobných položek potřebných k vytvoření doporučení. Ve výchozím nastavení je tato hodnota 2, což znamená, že pokud máte několik položek, které se vztahují na základě toho, že jsou ohodnoceni stejnými uživateli, můžete je považovat za související a vygenerovat doporučení.
(Volitelné). Pokud máte datovou sadu uživatelských funkcí, připojte ji k uživatelským funkcím.
První sloupec v datové sadě uživatelských funkcí by měl obsahovat identifikátor uživatele. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují uživatele, například jejich pohlaví, předvolby, umístění atd.
Funkce pro uživatele, kteří mají hodnocené položky, se ignorují doporučeným nástrojem skore Matchbox, protože tyto funkce se už během školení dozvěděly. Proto můžete datovou sadu předem vyfiltrovat, aby zahrnovala pouze studené uživatelenebo uživatele, kteří nehodnotili žádné položky.
Upozornění
Pokud byl model vyškolený bez použití uživatelských funkcí, nelze během bodování použít uživatelské funkce.
Volitelné Máte-li datovou sadu funkcí položky, můžete ji připojit k funkcím položek.
První sloupec v datové sadě funkcí položky musí obsahovat identifikátor položky. Zbývající sloupce by měly obsahovat hodnoty, které charakterizují položku.
Funkce hodnocených položek se ignorují doporučeným nástrojem skore Matchbox, protože tyto funkce se už během školení dozvěděly. Proto můžete omezit datovou sadu bodování na položky pro studený startnebo položky, které nebyly ohodnoceny žádnými uživateli.
Upozornění
Pokud byl model vyškolený bez použití funkcí položky, při bodování nepoužívejte funkce položek.
Volitelné Ve prediktivním experimentu můžete použít pátý vstupní port s názvem školicí datová sadak odebrání stávajících uživatelů zahrnutých do modelu školení dat z výsledků předpovědi.
Chcete-li použít tento filtr, připojte původní datovou sadu školení ke vstupnímu portu.
Spusťte experiment.
Výsledky pro související položky
Vyhodnocená datová sada vrácená funkcí skore Matchbox doporučuje doporučit seznam souvisejících položek pro každou položku ve vstupní datové sadě.
První sloupec obsahuje identifikátor cílové položky (položka zadaná jako vstup).
Další sloupce jsou generovány obsahující identifikátory souvisejících položek. Počet dalších sloupců závisí na hodnotě, kterou jste nastavili v možnosti, na maximálním počtu souvisejících položek, které se mají najít pro položku.
Související položky jsou seřazené podle síly vztahu k cílové položce, která má nejvíce související položku ve sloupci, související položka 1.
Technické poznámky
V této části najdete odpovědi na některé běžné dotazy týkající se použití doporučení k vytvoření předpovědi.
Uživatelé a doporučení pro studený start
Chcete-li vytvořit doporučení, je obvykle potřeba, aby modul hodnocení skóre Matchbox měl stejné vstupy, které jste použili při výuce modelu, včetně ID uživatele. Důvodem je to, že algoritmus potřebuje zjistit, jestli se během školení dozvěděl o tomto uživateli něco.
Pro nové uživatele ale možná nemáte ID uživatele, jenom některé uživatelské funkce, jako je třeba stáří, pohlaví a tak dále.
Můžete přesto vytvořit doporučení pro uživatele, kteří jsou ve vašem systému noviní, a to tak, že je zařadíte jako Uživatelé z chladírenského startu. U takových uživatelů algoritmus doporučení nepoužívá minulou historii ani předchozí hodnocení, jenom uživatelské funkce.
Pro účely předpovědi je uživatel se studeným startem definovaný jako uživatel s ID, který se pro školení nepoužil. Chcete-li zajistit, že ID se neshodují s ID používanými při výuce, můžete vytvořit nové identifikátory. Můžete například vygenerovat náhodná ID v zadaném rozsahu nebo přidělit sérii identifikátorů předem pro uživatele studeného startu.
Pokud ale nemáte žádná data pro filtrování spolupráce, jako je například vektor uživatelských funkcí, je lepší používat informace o klasifikaci nebo regresi.
Provozní použití doporučení Matchbox
Pokud jste se dozkoušeli na doporučení Matchbox a pak model přesunete do produkčního prostředí, pamatujte na tyto klíčové rozdíly při použití doporučení v režimu vyhodnocování a v provozním režimu:
Vyhodnocení, podle definice, vyžaduje předpovědi, které lze ověřit proti zemi v sadě testů. Proto při vyhodnocení doporučení, musí předpovědět pouze položky, které byly ohodnoceny v sadě testů. To nutně omezuje možné hodnoty, které jsou předpovězeny.
Když však model zprovozněníte, obvykle změníte režim předpovědi tak, aby vytvářely doporučení na základě všech možných položek, aby bylo možné získat nejlepší předpovědi. Pro mnohé z těchto předpovědi neexistuje žádná odpovídající země, takže přesnost doporučení nelze ověřit stejným způsobem jako při experimentování.
Pokud neposkytnete ID uživatele v produkčním prostředí a zadáte jenom vektor funkce, můžete jako odpověď získat seznam všech doporučení pro všechny možné uživatele. Nezapomeňte zadat ID uživatele.
Chcete-li omezit počet vrácených doporučení, můžete také určit maximální počet vrácených položek na uživatele.
Předpovědi není možné vygenerovat pouze pro položky, které nebyly dříve ohodnoceny. Toto chování je úmyslné.
Důvodem je, že aby bylo možné doporučit pouze položky, které nebyly ohodnoceny, doporučuje se, aby si doporučení uložilo celou sadu školicích dat s modelem, což by zvýšilo využití úložiště.
Pokud chcete doporučit jenom položky, které vám uživatel neviděl, můžete požádat o další položky, které se mají doporučit, a pak tyto hodnocení vyfiltrovat ručně.
Průběžná aktualizace doporučení
Online aktualizace (nebo průběžné školení) modelu doporučení se v Machine Learning aktuálně nepodporuje. Pokud chcete zachytit reakce uživatelů na doporučení a použít je ke zlepšení modelu, doporučujeme pravidelně přeškolovat kompletní model. Přírůstkové školení není možné, ale u školicích dat můžete použít posuvná okna, abyste měli jistotu, že při použití nejnovějších dat je minimalizován datový svazek.
Očekávané vstupy
Název | Typ | Description |
---|---|---|
Trained – doporučený Matchbox | ILearner | Trained – doporučený Matchbox |
Datová sada pro skóre | Tabulka dat | Datová sada pro skóre |
Uživatelské funkce | Tabulka dat | Datová sada obsahující funkce, které popisují uživatele Tato data jsou volitelná. |
Funkce položek | Tabulka dat | Datová sada obsahující funkce, které popisují položky Tato data jsou volitelná. |
Parametry modulu
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Druh predikce doporučovateče | Seznam | Druh predikce | Doporučení položky | Určení typu predikce, která by měla být výstupem doporučovateče |
Výběr doporučené položky | Seznam | Výběr položky | Z hodnocených položek (pro vyhodnocení modelu) | Vyberte sadu položek, ze které chcete vytvořit doporučení. |
Výběr souvisejícího uživatele | Seznam | Výběr uživatele | Od uživatelů, kteří hodnotí položky (pro vyhodnocení modelu) | Vyberte sadu uživatelů, které se mají použít při hledání souvisejících položek. |
Výběr související položky | Seznam | [Výběr položky | Z hodnocených položek (pro vyhodnocení modelu) | Vyberte sadu položek, které se budou používat při hledání souvisejících položek. |
Výstupy
Název | Typ | Description |
---|---|---|
Datová sada se skóre | Tabulka dat | Datová sada se skóre |
Výjimky
Výjimka | Description |
---|---|
Chyba 0022 | K výjimce dojde, pokud se počet vybraných sloupců ve vstupní datové sadě nerovná očekávanému počtu. |
Chyba 0036 | K výjimce dochází v případě, že byl pro daného uživatele nebo položku poskytnuto více vektorů funkcí. |
Chyba 0013 | K výjimce dochází v případě, že je předaný modulu learneru neplatný typ. |
Chyba 0035 | K výjimce dochází v případě, že pro daného uživatele nebo položku nebyly k dispozici žádné funkce. |
Chyba 0053 | K výjimce dochází v případě, že neexistují žádné uživatelské funkce nebo položky pro doporučení Matchboxu. |
Chyba 0003 | K výjimce dochází v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdný. |
Seznam chyb specifických pro moduly sady Studio (classic) najdete v Machine Learning kódy chyb.
Seznam výjimek rozhraní API najdete v tématu Machine Learning REST API kódy chyb.
Viz také
Trénování doporučovateče Matchboxu
Vyhodnocení doporučovacího systému
Skóre