Partager via


Score Matchbox Recommender

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Évalue des prédictions pour un jeu de données à l'aide du système de recommandation de Matchbox

catégorie : Machine Learning/Score

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module Score Matchbox recommender dans Machine Learning Studio (classic) pour créer des prédictions basées sur un modèle de recommandation formé, en fonction de l’algorithme Matchbox de Microsoft Research.

Le conseiller Matchbox peut générer quatre types différents de prédictions :

Lors de la création de ces trois types de prédictions, vous pouvez travailler en mode production ou en mode évaluation.

  • Le mode de production prend en compte tous les utilisateurs ou éléments, et est généralement utilisé dans un service web.

    Vous pouvez créer des scores pour les nouveaux utilisateurs, pas seulement pour les utilisateurs vus au cours de l’apprentissage. Pour plus d’informations, consultez cette section.

  • Le mode d’évaluation fonctionne sur un ensemble réduit d’utilisateurs ou d’éléments qui peut être évalué, et est généralement utilisé pendant l’expérimentation.

Conseil

Découvrez tout ce que vous devez savoir sur l’expérience de bout en bout de la création d’un système de recommandation dans ce didacticiel à partir de l’équipe de développement .NET. contient un exemple de code et une description de l’appel de Machine Learning à partir d’une application.

Génération du moteur de recommandation pour les applications .NET à l’aide de Machine Learning

En savoir plus sur le conseiller Matchbox

L’objectif de la création d’un système de recommandation est de recommander un ou plusieurs « éléments » aux « utilisateurs » du système. Les exemples d’un élément peuvent être un film, un restaurant, un livre ou une chanson. Un utilisateur peut être une personne, un groupe de personnes ou une autre entité avec des préférences d’élément.

Il existe deux approches principales pour les systèmes de recommandation. La première est l’approche basée sur le contenu, qui utilise des fonctionnalités à la fois pour les utilisateurs et les éléments. Les utilisateurs peuvent être décrits par des propriétés telles que l’âge et le sexe, et les éléments peuvent être décrits par des propriétés telles que l’auteur et le fabricant. Vous trouverez des exemples typiques de systèmes de recommandations basés sur le contenu sur les réseaux sociaux. La deuxième approche est le filtrage collaboratif, qui utilise uniquement les identificateurs des utilisateurs et des éléments, et obtient des informations implicites sur ces entités à partir d’une matrice (éparse) d’évaluations fournies par les utilisateurs aux éléments. Nous pouvons en savoir plus sur les éléments qu’ils ont notés et sur les autres utilisateurs ayant évalué les mêmes éléments.

Le générateur de recommandations Matchbox combine l'approche du filtrage collaboratif et l'approche basée sur le contenu. Il est donc considéré comme un système de recommandation hybride. Quand un utilisateur est relativement nouveau pour le système, les prédictions sont améliorées en exploitant les informations spécifiques relatives à l'utilisateur, et donc en abordant le problème bien connu du « démarrage à froid ». Toutefois, après avoir recueilli un nombre suffisant d'évaluations d'un utilisateur particulier, il est possible d'élaborer des prédictions entièrement personnalisées en fonction de ses propres évaluations plutôt que de ses seules caractéristiques. Il en résulte donc une transition en douceur de recommandations basées sur le contenu vers des recommandations basées sur un filtrage collaboratif. Même lorsque les fonctionnalités utilisateur ou élément ne sont pas disponibles, Matchbox fonctionne toujours en mode de filtrage collaboratif.

Pour plus d'informations sur le générateur de recommandations Matchbox et son algorithme probabiliste sous-jacent, consultez l'étude qui lui est consacrée :

Exemples

Pour obtenir des exemples de création de scores à partir d’un moteur de recommandation, consultez la Azure ai Gallery.

  • Recommandations Everywhere: ce billet de blog fournit une introduction générale aux systèmes de recommandation avec un grand nombre d’aides visuelles.

Comment configurer le score Matchbox recommender

Ce module prend en charge différents types de recommandations, chacune avec des exigences différentes. Cliquez sur le lien correspondant au type de données que vous avez et au type de recommandation que vous souhaitez créer.

Prédire des notations

Lorsque vous prédisez des notations, le modèle calcule la manière dont un utilisateur donné réagira à un élément particulier, en fonction des données d’apprentissage. Par conséquent, les données d’entrée pour le calcul de score doivent fournir à la fois l’utilisateur et l’élément à évaluer.

  1. Ajoutez un modèle de recommandation formé à votre expérience et connectez-le à un conseiller Matchbox formé. Vous devez créer le modèle à l’aide de la commande train Matchbox recommender.

  2. Type de prédiction de recommandation : Sélectionnez Prédiction de notations. Aucun paramètre supplémentaire n’est nécessaire.

  3. Ajoutez les données pour lesquelles vous souhaitez effectuer des prédictions et connectez-les au Jeu de données à noter.

    Pour prédire les notations, le jeu de données d’entrée doit contenir des paires utilisateur-élément.

    Le jeu de données peut contenir une troisième colonne de notation facultative pour la paire utilisateur-élément dans la première et la deuxième colonne, mais la troisième colonne sera ignorée pendant la prédiction.

  4. (Facultatif). Si vous disposez d’un jeu de données de caractéristiques d’utilisateurs, connectez-le aux Caractéristiques d’utilisateurs.

    Le jeu de données de caractéristiques d’utilisateurs doit contenir l’identificateur de l’utilisateur dans la première colonne. Les colonnes restantes doivent contenir des valeurs qui caractérisent les utilisateurs, comme leur sexe, leurs préférences, leur emplacement, etc.

    Les fonctionnalités des utilisateurs qui ont des éléments notés sont ignorées par score Matchbox recommender, car elles ont déjà été apprises lors de la formation. Par conséquent, filtrez votre jeu de données à l’avance pour inclure uniquement les utilisateurs qui démarrent à froid ou les utilisateurs qui n’ont évalué aucun élément.

    Avertissement

    Si le modèle a été formé sans utiliser les caractéristiques d’utilisateurs, vous ne pouvez pas introduire de caractéristiques d’utilisateurs lors du scoring.

  5. Si vous avez un jeu de données de caractéristiques d’éléments, vous pouvez le connecter aux Caractéristiques d'éléments.

    Le jeu de données de caractéristiques d’éléments doit contenir un identificateur d’élément dans la première colonne. Les autres colonnes doivent contenir des valeurs qui caractérisent les éléments.

    Les fonctionnalités des éléments classés sont ignorées par score Matchbox Recommendation , car elles ont déjà été apprises lors de la formation. Par conséquent, limitez votre jeu de données de scoring aux éléments qui démarrent à froid ou aux éléments qui n’ont pas été évalués par des utilisateurs.

    Avertissement

    Si le modèle a été formé sans utiliser les caractéristiques d’éléments, vous ne pouvez pas introduire de caractéristiques d’éléments lors du scoring.

  6. Utilisez le cinquième port d’entrée, nommé jeu de données d’apprentissage, pour supprimer les éléments qui ont déjà été évalués dans les résultats de prédiction.

    Pour appliquer ce filtre, connectez le jeu de données d’entraînement d’origine au port d’entrée.

  7. Exécutez l’expérience.

Résultats des prédictions de notation

Le jeu de données de sortie contient trois colonnes, contenant l’utilisateur, l’élément, et la notation prédite pour chaque utilisateur et élément d’entrée.

En outre, les modifications suivantes sont appliquées au moment du scoring :

  • Les valeurs manquantes dans les colonnes de fonctionnalités d’un utilisateur ou d’un élément sont automatiquement remplacées par le mode de ses valeurs de jeu d’apprentissage non manquantes.

  • Toutes les fonctionnalités d’utilisateur et d’élément sont mises à l’échelle en fonction des valeurs absolues maximales correspondantes rencontrées dans l’apprentissage.

  • Aucune traduction n'est appliquée aux valeurs de caractéristiques, afin de maintenir leur caractère épars.

  • Les caractéristiques à valeur de chaîne sont converties en un ensemble de caractéristiques indicatrices à valeur binaire.

Recommander

Pour recommander des éléments pour les utilisateurs, vous fournissez une liste d’utilisateurs et d’éléments comme entrée. À partir de ces données, le modèle utilise ses connaissances sur les éléments et les utilisateurs existants afin de générer une liste d’éléments avec un attrait probable pour chaque utilisateur. Vous pouvez personnaliser le nombre de recommandations renvoyées et définir un seuil pour le nombre de recommandations précédentes requises pour générer une recommandation.

  1. Ajoutez un modèle de recommandation formé à votre expérience et connectez-le à un conseiller Matchbox formé. Vous devez créer le modèle à l’aide de la commande train Matchbox recommender.

  2. Pour recommander des éléments pour une liste donnée d’utilisateurs, définissez Type de prédiction de recommandation sur Recommandation d’éléments.

  3. Sélection d’éléments recommandés : Indiquez si vous utilisez le module de notation en production ou pour l’évaluation de modèle, en choisissant l’une des valeurs suivantes :

    • À partir d’éléments notés (pour l’évaluation du modèle) : Sélectionnez cette option si vous développez ou testez un modèle. Cette option active le mode d’évaluation, le module génère alors des recommandations uniquement à partir des éléments du jeu de données d’entrée qui ont été évalués.

    • À partir de tous les éléments : Sélectionnez cette option si vous configurez un essai pour une utilisation dans un service web ou en production. Cette option active le mode de production, le module émet alors des recommandations à partir de tous les éléments vus pendant l’entraînement.

  4. Ajoutez le jeu de données pour lequel vous souhaitez effectuer des prédictions et connectez-le au Jeu de données à noter.

    • Si vous choisissez l’option À partir de tous les éléments, le jeu de données d’entrée doit se composer d’une seule colonne, contenant les identificateurs des utilisateurs pour lesquels formuler des recommandations.

      Si le DataSet contient plusieurs colonnes, une erreur est générée. Utilisez le module Sélectionner des colonnes dans le jeu de données pour supprimer des colonnes supplémentaires du jeu de données d’entrée.

    • Si vous choisissez l’option À partir d’éléments notés (pour l’évaluation du modèle) , le jeu de données d’entrée doit être composé de paires utilisateur-élément. La première colonne doit contenir l’identificateur d’utilisateur. La deuxième colonne doit contenir les identificateurs d’élément correspondants.

      Le jeu de données peut inclure une troisième colonne de notations utilisateur-élément, mais cette colonne est ignorée.

  5. (Facultatif). Si vous disposez d’un jeu de données de caractéristiques d’utilisateurs, connectez-le aux Caractéristiques d’utilisateurs.

    La première colonne du jeu de données des caractéristiques d’utilisateurs doit contenir l’identificateur de l’utilisateur. Les colonnes restantes doivent contenir des valeurs qui caractérisent l’utilisateur, comme le sexe, les préférences, l’emplacement, etc.

    Les fonctionnalités des utilisateurs qui ont des éléments notés sont ignorées par score Matchbox recommender, car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, vous pouvez filtrer votre jeu de données à l’avance pour inclure uniquement les utilisateurs qui démarrent à froid ou les utilisateurs qui n’ont évalué aucun élément.

    Avertissement

    Si le modèle a été formé sans utiliser les caractéristiques d’utilisateurs, vous ne pouvez pas appliquer des caractéristiques d’utilisateurs lors du scoring.

  6. (Facultatif) Si vous avez un jeu de données de caractéristiques d’éléments, vous pouvez le connecter aux Caractéristiques d'éléments.

    La première colonne du jeu de données de caractéristiques d’éléments doit contenir l’identificateur d’élément. Les autres colonnes doivent contenir des valeurs qui caractérisent les éléments.

    Les fonctionnalités des éléments évalués sont ignorées par score Matchbox recommender, car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, vous pouvez limiter votre jeu de données de scoring aux éléments qui démarrent à froid ou aux éléments qui n’ont pas été évalués par des utilisateurs.

    Avertissement

    Si le modèle a été formé sans utiliser de caractéristiques d'éléments, n'utilisez pas celles-ci lors du calcul de score.

  7. Nombre maximal d’éléments à recommander à un utilisateur : Saisissez le nombre d’éléments à retourner pour chaque utilisateur. Par défaut, 5 éléments sont recommandés.

  8. Taille minimale du pool de recommandations par utilisateur : saisissez une valeur qui indique le nombre de recommandations antérieures requises. Par défaut, ce paramètre est défini sur 2, ce qui signifie que l’élément doit avoir été recommandé par au moins deux autres utilisateurs.

    Cette option ne doit être utilisée que si vous effectuez une notation en mode évaluation. L’option n’est pas disponible si vous sélectionnez parmi tous les éléments.

  9. Exécutez l’expérience.

Résultats de la recommandation d’élément

Le jeu de données au score calculé renvoyé par le module Score Matchbox Recommender répertorie les éléments recommandés pour chaque utilisateur.

  • La première colonne contient les identificateurs d’utilisateur.
  • Plusieurs colonnes supplémentaires sont générées, en fonction de la valeur que vous avez définie pour Nombre maximal d’éléments à recommander à un utilisateur. Chaque colonne contient un élément recommandé (par identificateur). Les recommandations sont classées par affinité utilisateur-élément, l’élément disposant de l’affinité la plus élevée est placé dans la colonne Élément 1.

Avertissement

Ce jeu de données noté ne peut pas être évalué à l’aide du module Évaluer le générateur de recommandations.

Rechercher les utilisateurs associés

L’option permettant de rechercher des utilisateurs associés est utile si vous recommandez des « personnes comme vous », ou si vous créez un pool d’utilisateurs similaires sur lesquels baser d’autres types de prédictions.

  1. Ajoutez un modèle de recommandation formé à votre expérience et connectez-le à un conseiller Matchbox formé. Vous devez créer le modèle à l’aide de la commande train Matchbox recommender.

  2. Type de prédiction de recommandation: sélectionnez utilisateurs associés.

  3. Sélection de l' utilisateur connexe: indiquez comment vous allez utiliser le modèle pour la notation et spécifiez le pool d’utilisateurs sur lequel baser les scores, comme suit :

    • À partir de tous les utilisateurs: sélectionnez cette option si vous configurez une expérience à utiliser dans un service Web ou un environnement de production, ou si vous devez effectuer des prédictions pour les nouveaux utilisateurs. Cette option active le mode productionet le module base sa recommandation uniquement sur les utilisateurs vus pendant la formation.

    • À partir des utilisateurs qui ont évalué des éléments (pour l’évaluation de modèle): sélectionnez cette option si vous développez ou testez un modèle. Cette option active le mode d’évaluation, et le modèle fonde ses recommandations sur les utilisateurs du jeu de test qui ont évalué certains éléments courants.

  4. Connecter un jeu de données qui contient les utilisateurs pour lesquels des prédictions sont générées. Le format de ce jeu de données varie selon que vous utilisez le module de notation en mode production ou en mode évaluation.

    • Mode de production, utilisation de à partir de tous les éléments

      Le jeu de données à noter doit être composé d' utilisateurs pour lesquels vous souhaitez rechercher des utilisateurs associés. La première et la seule colonne doivent contenir les identificateurs d’utilisateur. Si d’autres colonnes sont incluses, une erreur est générée. Utilisez le module Sélectionner des colonnes dans le jeu de données pour supprimer les colonnes inutiles.

    • Mode d’évaluation, à partir des éléments notés (pour l’évaluation du modèle)

      Le jeu de données à noter doit comprendre 2-3 colonnes, contenant des paires utilisateur-élément. La première colonne doit contenir des identificateurs d’utilisateur. La deuxième colonne doit contenir des identificateurs d’élément. Le jeu de données peut inclure une troisième colonne de classement (par l’utilisateur dans la colonne 1 pour l’élément de la colonne 2), mais la colonne des évaluations est ignorée.

  5. Nombre maximal d’utilisateurs liés à rechercher pour un utilisateur: tapez un nombre qui indique le nombre maximal de prédictions que vous souhaitez pour chaque utilisateur. La valeur par défaut est 5, ce qui signifie qu’au plus cinq utilisateurs connexes peuvent être retournés, mais dans certains cas, il peut y avoir moins de 5.

  6. En mode évaluation (pourles utilisateurs ayant évalué des éléments), configurez ces paramètres supplémentaires :

    • Nombre minimal d’éléments que l’utilisateur de la requête et l’utilisateur associé doivent avoir évalués en commun: cette valeur définit un seuil pour les recommandations. Le nombre que vous tapez représente le nombre minimal d’éléments que votre utilisateur cible et l’utilisateur associé potentiel doivent avoir évalués. La valeur par défaut est 2, ce qui signifie qu’au minimum deux éléments doivent avoir été évalués par les deux utilisateurs.

    • Taille minimale du pool d’utilisateurs associé pour un seul utilisateur: cette valeur contrôle le nombre minimal d’utilisateurs similaires nécessaires pour créer une recommandation. Par défaut, la valeur est 2, ce qui signifie que si vous avez au moins deux utilisateurs liés par le biais de l’évaluation des mêmes éléments, vous pouvez les considérer comme liés et générer une recommandation.

  7. (Facultatif). Si vous disposez d’un jeu de données de caractéristiques d’utilisateurs, connectez-le aux Caractéristiques d’utilisateurs.

    La première colonne du jeu de données des caractéristiques d’utilisateurs doit contenir l’identificateur de l’utilisateur. Les colonnes restantes doivent contenir des valeurs qui caractérisent l’utilisateur, telles que le sexe, les préférences, l’emplacement, etc.

    Les fonctionnalités des utilisateurs qui ont des éléments classés sont ignorées par score Matchbox Recommendation , car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, filtrez votre jeu de données à l’avance pour inclure uniquement les utilisateurs qui démarrent à froid ou les utilisateurs qui n’ont évalué aucun élément.

    Avertissement

    Si le modèle a été formé sans utiliser les fonctionnalités de l’utilisateur, vous ne pouvez pas appliquer les fonctionnalités de l’utilisateur pendant l’évaluation.

  8. Facultatif Si vous avez un jeu de données de fonctionnalités d’élément, connectez-le à des fonctionnalités d’élément.

    La première colonne du jeu de données de caractéristiques d’éléments doit contenir l’identificateur d’élément. Les autres colonnes doivent contenir des valeurs qui caractérisent les éléments.

    Les fonctionnalités des éléments classés sont ignorées par score Matchbox Recommendation , car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, vous pouvez limiter votre jeu de données de notation aux éléments de démarrage à froidou aux éléments qui n’ont pas été évalués par des utilisateurs.

    Avertissement

    Si le modèle a été formé sans utiliser de caractéristiques d'éléments, n'utilisez pas celles-ci lors du calcul de score.

  9. Exécutez l’expérience.

Le jeu de données noté renvoyé par score Matchbox recommender répertorie les utilisateurs qui sont liés à chaque utilisateur dans le jeu de données d’entrée.

Pour chaque utilisateur spécifié dans le jeu de données d’entrée, le jeu de données de résultats contient un ensemble d’utilisateurs associés.

  • La première colonne contient l’identificateur de l’utilisateur cible (l’utilisateur fourni comme entrée).

  • Des colonnes supplémentaires sont générées, contenant les identificateurs des utilisateurs associés. Le nombre de colonnes supplémentaires dépend de la valeur que vous avez définie dans l’option, nombre maximal d’utilisateurs associés à rechercher pour un utilisateur.

    Les utilisateurs associés sont classés par la force de la relation avec l’utilisateur cible, avec l’utilisateur le plus étroitement lié dans la colonne, utilisateur 1 associé.

Rechercher les éléments associés

En prédisant les éléments associés, vous pouvez générer des recommandations pour les utilisateurs en fonction des éléments qui ont déjà été évalués.

  1. Ajoutez un modèle de recommandation formé à votre expérience et connectez-le à un conseiller Matchbox formé. Vous devez créer le modèle à l’aide de la commande train Matchbox recommender.

  2. Type de prédiction de recommandation: sélectionnez les éléments associés.

  3. Connecter un jeu de données qui contient les utilisateurs pour lesquels des prédictions sont générées. Le format de ce jeu de données varie selon que vous utilisez le module de notation en mode production ou en mode évaluation.

    • Mode de production, utilisation de à partir de tous les éléments

      Le jeu de données à noter doit comprendre les éléments pour lesquels vous souhaitez rechercher des utilisateurs associés.

      La première et la seule colonne doivent contenir les identificateurs d’élément. Si d’autres colonnes sont incluses, une erreur est générée. Utilisez le module Sélectionner des colonnes dans le jeu de données pour supprimer les colonnes inutiles.

    • Mode d’évaluation, à partir des éléments notés (pour l’évaluation du modèle)

      Le jeu de données à noter doit comprendre 2-3 colonnes, contenant des paires utilisateur-élément. La première colonne doit contenir des identificateurs d’utilisateur. La deuxième colonne doit contenir des identificateurs d’élément.

      Le DataSet peut inclure une troisième colonne d’évaluations (par l’utilisateur de la colonne 1 pour l’élément de la colonne 2), mais la colonne des évaluations est ignorée.

  4. Nombre maximal d’éléments associés à rechercher pour un élément> : tapez un nombre qui indique le nombre maximal de prédictions que vous souhaitez pour chaque élément.

    La valeur par défaut est 5, ce qui signifie qu’au plus cinq éléments connexes peuvent être retournés, mais il peut y en avoir moins de 5.

  5. Si vous utilisez le mode d’évaluation (pour les utilisateurs ayant évalué des éléments), configurez ces paramètres supplémentaires :

    • Nombre minimal d’éléments dont l’élément de requête et l’élément connexe doivent avoir été évalués en commun: cette valeur définit un seuil pour les recommandations. Le nombre que vous tapez représente le nombre minimal d’éléments qui ont été évalués par l’utilisateur cible et certains utilisateurs associés. La valeur par défaut est 2, ce qui signifie qu’au minimum, deux éléments doivent avoir été évalués par l’utilisateur cible et l’utilisateur associé.

    • Taille minimale du pool d’éléments associés pour un seul élément: cette valeur contrôle le nombre minimal d’éléments similaires nécessaires à la création d’une recommandation. Par défaut, la valeur est 2, ce qui signifie que, si vous avez au moins deux éléments liés en raison d’une évaluation par les mêmes utilisateurs, vous pouvez les considérer comme liés et générer une recommandation.

  6. (Facultatif). Si vous disposez d’un jeu de données de caractéristiques d’utilisateurs, connectez-le aux Caractéristiques d’utilisateurs.

    La première colonne du jeu de données des caractéristiques d’utilisateurs doit contenir l’identificateur de l’utilisateur. Les colonnes restantes doivent contenir des valeurs qui caractérisent l’utilisateur, comme le sexe, les préférences, l’emplacement, etc.

    Les fonctionnalités des utilisateurs qui ont des éléments notés sont ignorées par score Matchbox recommender, car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, vous pouvez filtrer votre jeu de données à l’avance pour inclure uniquement les utilisateurs qui démarrent à froid ou les utilisateurs qui n’ont évalué aucun élément.

    Avertissement

    Si le modèle a été formé sans utiliser les fonctionnalités de l’utilisateur, vous ne pouvez pas appliquer les fonctionnalités de l’utilisateur pendant l’évaluation.

  7. Facultatif Si vous avez un jeu de données de fonctionnalités d’élément, vous pouvez le connecter à des fonctionnalités d’élément.

    La première colonne du jeu de données de caractéristiques d’éléments doit contenir l’identificateur d’élément. Les colonnes restantes doivent contenir des valeurs qui caractérisent l’élément.

    Les fonctionnalités des éléments évalués sont ignorées par score Matchbox recommender, car ces fonctionnalités ont déjà été apprises lors de la formation. Par conséquent, vous pouvez limiter votre jeu de données de notation aux éléments de démarrage à froidou aux éléments qui n’ont pas été évalués par des utilisateurs.

    Avertissement

    Si le modèle a été formé sans utiliser de caractéristiques d'éléments, n'utilisez pas celles-ci lors du calcul de score.

  8. Facultatif Dans une expérience prédictive, vous pouvez utiliser un cinquième port d’entrée, nommé jeude données d’apprentissage, pour supprimer les utilisateurs existants qui étaient inclus dans les données d’apprentissage du modèle des résultats de prédiction.

    Pour appliquer ce filtre, connectez le jeu de données d’entraînement d’origine au port d’entrée.

  9. Exécutez l’expérience.

Le jeu de données noté renvoyé par score Matchbox recommender répertorie les éléments associés pour chaque élément du jeu de données d’entrée.

  • La première colonne contient l’identificateur de l’élément cible (l’élément fourni comme entrée).

  • Des colonnes supplémentaires sont générées, contenant les identificateurs des éléments associés. Le nombre de colonnes supplémentaires dépend de la valeur que vous avez définie dans l’option nombre maximal d’éléments associés à rechercher pour un élément.

    Les éléments associés sont classés par la force de la relation à l’élément cible, avec l’élément le plus étroitement lié dans la colonne, élément associé 1.

Notes techniques

Cette section contient des réponses à certaines questions courantes sur l’utilisation du générateur de recommandations pour créer des prédictions.

Utilisateurs démarrant à froid et recommandations

En général, pour créer des recommandations, le module score Matchbox recommender requiert les mêmes entrées que celles que vous avez utilisées lors de l’apprentissage du modèle, y compris un ID d’utilisateur. Cela est dû au fait que l’algorithme a besoin de savoir s’il a appris des choses sur cet utilisateur au cours de la formation.

Toutefois, s'il s'agit d'un nouvel utilisateur, vous ne disposez peut-être pas d'un identifiant, mais uniquement de certaines caractéristiques telles que l'âge, le sexe et autres.

Vous pouvez toujours générer des recommandations pour des utilisateurs nouveaux dans votre système, en les traitant comme des utilisateurs qui démarrent à froid. Dans ce cas, l'algorithme de recommandation n'utilise pas l'historique ou des évaluations précédentes, mais uniquement les caractéristiques de l'utilisateur.

À des fins de prédiction, un utilisateur qui démarre à froid est défini comme un utilisateur dont l'identifiant n'a pas été utilisé pour la formation. Pour vous assurer que les ID ne correspondent pas aux ID utilisés lors de la formation, vous pouvez créer des identificateurs. Par exemple, vous pouvez générer des identifiants aléatoires dans une plage spécifiée, ou allouer à l'avance une série d'identifiants aux futurs nouveaux utilisateurs.

Toutefois, si vous n'avez pas de données de filtrage collaboratives, telles qu'un vecteur de caractéristiques d'utilisateur, il est préférable d'utiliser un dispositif d'apprentissage par classification ou régression.

Utilisation de production du conseiller Matchbox

Si vous avez expérimenté le conseiller Matchbox, puis que vous déplacez le modèle en production, tenez compte de ces différences clés lors de l’utilisation du conseiller en mode évaluation et en mode production :

  • L’évaluation, par définition, requiert des prédictions qui peuvent être vérifiées par rapport à la vérité de terrain dans un jeu de test. Par conséquent, lorsque vous évaluez le générateur de recommandations, il doit prédire uniquement les éléments qui ont été évalués dans le jeu de test. Cela restreint nécessairement les valeurs possibles qui sont prédites.

    Toutefois, lorsque vous procédez au fonctionnement du modèle, vous modifiez généralement le mode de prédiction pour effectuer des recommandations en fonction de tous les éléments possibles, afin d’obtenir les meilleures prédictions. Pour la plupart de ces prédictions, il n’y a pas de vérité de terrain correspondante, ainsi la précision de la recommandation ne peut pas être vérifiée de la même façon que lors de l’expérimentation.

  • Si vous ne fournissez pas d'identifiant d'utilisateur en production, mais uniquement un vecteur de caractéristiques, vous pouvez obtenir en réponse la liste de toutes les recommandations pour tous les utilisateurs possibles. Veillez à fournir un identifiant utilisateur.

    Pour limiter le nombre de recommandations renvoyées, vous pouvez également spécifier le nombre maximal d'éléments renvoyés par utilisateur.

  • Il n'est pas possible de générer des prédictions uniquement pour des éléments non évalués précédemment. C'est la procédure normale.

    En effet, pour recommander uniquement les éléments qui n’ont pas été évalués, le conseiller doit stocker le jeu de données d’apprentissage complet avec le modèle, ce qui augmente l’utilisation du stockage.

    Si vous souhaitez recommander uniquement des éléments qui n'ont pas été vus par votre utilisateur, vous pouvez demander davantage d'éléments à recommander, puis filtrer manuellement ceux qui ont été évalués.

Mise à jour continue du conseiller

La mise à jour en ligne (ou formation continue) d’un modèle de recommandation n’est actuellement pas prise en charge dans Machine Learning. Si vous souhaitez capturer les réponses des utilisateurs aux recommandations et les utiliser pour améliorer le modèle, nous vous suggérons de recommencer régulièrement l’apprentissage du modèle complet. L’apprentissage incrémentiel n’est pas possible, mais vous pouvez appliquer une fenêtre glissante aux données d’apprentissage pour vous assurer que le volume de données est réduit lors de l’utilisation des données les plus récentes.

Entrées attendues

Nom Type Description
Matchbox Recommender formé ILearner Matchbox Recommender formé
Jeu de données à évaluer Table de données Jeu de données à évaluer
Caractéristiques d'utilisateurs Table de données Jeu de données contenant des caractéristiques qui décrivent les utilisateurs

Ces données sont facultatives
Caractéristiques d'éléments Table de données Jeu de données contenant des caractéristiques qui décrivent les éléments

Ces données sont facultatives

Paramètres du module

Nom Plage Type Default Description
Type de prédiction du générateur de recommandations Liste Type de prédiction Recommandation d'élément Spécifiez le type de prédiction que le générateur de recommandations doit générer
Sélection d'élément recommandé Liste Sélection d’élément À partir d'éléments d'évalués (pour l'évaluation de modèle) Sélectionnez le jeu d'éléments à partir desquels effectuer des recommandations
Sélection d'utilisateur associé Liste Sélection de l'utilisateur À partir d'utilisateurs ayant évalué des éléments (pour l'évaluation de modèle) Sélectionnez le jeu d'utilisateurs à utiliser lors de la recherche d'éléments associés
Sélection d'élément associé Liste [Sélection de l’élément À partir d'éléments d'évalués (pour l'évaluation de modèle) Sélectionnez l'ensemble d'éléments à utiliser lors de la recherche d'éléments associés

Sorties

Nom Type Description
Jeu de données noté Table de données Jeu de données noté

Exceptions

Exception Description
Erreur 0022 Une exception se produit si le nombre de colonnes sélectionnées dans le jeu de données en entrée n’est pas égal au nombre attendu.
Erreur 0036 Une exception se produit si plusieurs vecteurs de fonctionnalité ont été fournis pour un utilisateur ou un élément donné.
Erreur 0013 Une exception se produit si la transmission à l'apprenant du module a un type non valide.
Erreur 0035 Une exception se produit si aucune fonctionnalité n’est fournie pour un utilisateur ou un élément donné.
Erreur 0053 Une exception se produit en cas d'absence de caractéristiques d'utilisateurs ou d'éléments pour les recommandations de Matchbox.
Erreur 0003 Cette exception se produit si une ou plusieurs entrées sont null ou vide.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Former la recommandation Matchbox
Évaluer le générateur de recommandations
Score