Pontuar Matchbox Recomendador
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Previsões de pontuação para um conjunto de dados usando o recomendador Matchbox
Categoria: Machine Learning / Pontuação
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
Visão geral do módulo
Este artigo descreve como usar o módulo Decomendador Score Matchbox em Machine Learning Studio (clássico), para criar previsões baseadas num modelo de recomendação treinado, baseado no algoritmo Matchbox da Microsoft Research.
O recomendador Matchbox pode gerar quatro tipos diferentes de previsões:
Ao criar os últimos três tipos de previsões, pode operar em modo de produção ou em modo de avaliação.
O modo de produção considera todos os utilizadores ou itens, e é normalmente usado num serviço web.
Pode criar pontuações para novos utilizadores, e não apenas para os utilizadores vistos durante o treino. Para mais informações, consulte esta secção.
O modo de avaliação funciona num conjunto reduzido de utilizadores ou itens que podem ser avaliados, e é normalmente utilizado durante a experimentação.
Dica
Saiba tudo o que precisa de saber sobre a experiência de ponta a ponta de construir um sistema de recomendação neste tutorial da equipa de desenvolvimento .NET. Inclui o código de amostra e a discussão de como chamá Machine Learning de uma aplicação.
Motor de recomendação de construção para aplicações .NET utilizando Machine Learning
Mais sobre o recomendador matchbox
O objetivo de criar um sistema de recomendação é recomendar um ou mais "itens" aos "utilizadores" do sistema. Exemplos de um item podem ser um filme, restaurante, livro ou música. Um utilizador pode ser uma pessoa, um grupo de pessoas ou outra entidade com preferências de produto.
Existem duas abordagens principais para os sistemas de recomendação. A primeira é a abordagem baseada em conteúdo , que faz uso de funcionalidades tanto para utilizadores como para itens. Os utilizadores podem ser descritos por propriedades como idade e sexo, e itens podem ser descritos por propriedades como autor e fabricante. Exemplos típicos de sistemas de recomendação baseados em conteúdo podem ser encontrados em sites de matchmaking sociais. A segunda abordagem é a filtragem colaborativa, que utiliza apenas identificadores dos utilizadores e dos itens e obtém informações implícitas sobre estas entidades a partir de uma matriz (escassa) de classificações dadas pelos utilizadores aos itens. Podemos aprender sobre um utilizador a partir dos itens que avaliaram e de outros utilizadores que avaliaram os mesmos itens.
O recomendador Matchbox combina filtragem colaborativa com uma abordagem baseada em conteúdo. É, portanto, considerado um recomendador híbrido. Quando um utilizador é relativamente novo no sistema, as previsões são melhoradas utilizando a informação da funcionalidade sobre o utilizador, abordando assim o conhecido problema do "arranque a frio". No entanto, uma vez que há um número suficiente de classificações de um determinado utilizador, é possível fazer previsões totalmente personalizadas para eles com base nas suas classificações específicas e não apenas nas suas funcionalidades. Assim, há uma transição suave das recomendações baseadas em conteúdo para recomendações baseadas na filtragem colaborativa. Mesmo quando as funcionalidades de utilizador ou item não estão disponíveis, a Matchbox ainda funciona no seu modo de filtragem colaborativo.
Mais detalhes sobre o recomendador matchbox e o seu algoritmo probabilístico subjacente podem ser encontrados no documento de investigação relevante:
Exemplos
Por exemplo, como criar pontuações a partir de um motor de recomendação, consulte a Galeria Azure AI.
Recomendação: Recomendação do filme: Esta amostra demonstra a recomendação do item, onde os itens são filmes, e também demonstra previsão de classificação.
Recomendador: Classificações de restaurante: Esta amostra demonstra recomendações de artigos utilizando funcionalidades de item e funcionalidades do utilizador.
- Recomendações Everywhere: Este blog post fornece uma introdução de alto nível a sistemas recomendadores com muitas ajudas visuais.
Como configurar o recomendador score matchbox
Este módulo suporta diferentes tipos de recomendações, cada uma com diferentes requisitos. Clique no link para o tipo de dados que tem e o tipo de recomendação que pretende criar.
- Prever classificações
- Recomendar itens
- Localizar utilizadores relacionados
- Encontre itens relacionados
Prever classificações
Quando se prevê classificações, o modelo calcula como um determinado utilizador irá reagir a um determinado item, dados os dados de formação. Por isso, os dados de entrada para a pontuação devem fornecer tanto um utilizador como o item para classificar.
Adicione um modelo de recomendação treinado à sua experiência e conecte-o ao recomendador de Matchbox treinado. Tem de criar o modelo utilizando o Recomendador train Matchbox.
Tipo de previsão de recomendação: Selecione Previsão de Classificação. Não são necessários mais parâmetros.
Adicione os dados para os quais deseja fazer previsões e conecte-os ao Dataset para obter.
Para prever as classificações, o conjunto de dados de entrada deve conter pares de artigos de utilizador.
O conjunto de dados pode conter uma terceira coluna opcional de classificações para o par de artigos de utilizador nas primeira e segunda colunas, mas a terceira coluna será ignorada durante a previsão.
(Opcional). Se tiver um conjunto de dados de funcionalidades do utilizador, conecte-a às funcionalidades do Utilizador.
O conjunto de dados das funcionalidades do utilizador deve conter o identificador do utilizador na primeira coluna. As colunas restantes devem conter valores que caracterizam os utilizadores, tais como o seu sexo, preferências, localização, etc.
As funcionalidades dos utilizadores que avaliaram os itens são ignoradas pelo Score Matchbox Recommender, porque já foram aprendidas durante o treino. Por isso, filtre previamente o seu conjunto de dados para incluir apenas utilizadores de arranque a frio ou utilizadores que não tenham avaliado quaisquer itens.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do utilizador, não é possível introduzir as funcionalidades do utilizador durante a pontuação.
Se tiver um conjunto de funcionalidades de item, pode conectá-lo às funcionalidades do Item.
O conjunto de dados de características do item deve conter um identificador de produto na primeira coluna. As colunas restantes devem conter valores que caracterizam os itens.
As características dos itens classificados são ignoradas pelo Score Matchbox Recommender , uma vez que já foram aprendidas durante o treino. Por isso, restrinja o conjunto de dados de pontuação a itens de arranque a frio ou itens que não tenham sido avaliados por nenhum utilizadores.
Aviso
Se o modelo foi treinado sem utilizar funcionalidades de itens, não é possível introduzir funcionalidades de itens durante a pontuação.
Utilize a quinta porta de entrada opcional, denominada Training Dataset, para remover itens que já foram classificados a partir dos resultados da previsão.
Para aplicar este filtro, ligue o conjunto de dados de treino original à porta de entrada.
Execute a experimentação.
Resultados das previsões de rating
O conjunto de dados de saída contém três colunas, contendo o utilizador, o item e a classificação prevista para cada utilizador e item de entrada.
Além disso, são aplicadas as seguintes alterações durante a pontuação:
Os valores em falta nas colunas de funcionalidades do utilizador ou do item são automaticamente substituídos pelo modo dos seus valores de conjunto de treino não desaparecidos.
Todas as funcionalidades de utilizador e item são redimensionada pelos valores máximos absolutos correspondentes vistos no treino.
Não é aplicada nenhuma tradução aos valores de recurso, para manter a sua sparsity.
As funções de valor de cordas são convertidas num conjunto de características indicadoras de valor binário.
Recomendar
Para recomendar itens para os utilizadores, fornece uma lista de utilizadores e itens como entrada. A partir destes dados, o modelo utiliza o seu conhecimento sobre itens e utilizadores existentes para gerar uma lista de itens com provável apelo a cada utilizador. Pode personalizar o número de recomendações devolvidas e definir um limiar para o número de recomendações anteriores que são necessárias para gerar uma recomendação.
Adicione um modelo de recomendação treinado à sua experiência e conecte-o ao recomendador de Matchbox treinado. Tem de criar o modelo utilizando o Recomendador train Matchbox.
Para recomendar itens para uma determinada lista de utilizadores, desateie o tipo de previsão do Recomendador à Recomendação de Item.
Seleção recomendada do item: Indique se está a utilizar o módulo de pontuação em produção ou para avaliação de modelos, escolhendo um destes valores:
A partir de Itens Classificados (para avaliação de modelos): Selecione esta opção se estiver a desenvolver ou testar um modelo. Esta opção permite o modo de avaliação, e o módulo faz recomendações apenas a partir dos itens do conjunto de dados de entrada que foram avaliados.
De todos os itens: Selecione esta opção se estiver a configurar uma experiência para utilizar num serviço web ou produção. Esta opção permite o modo de produção, e o módulo faz recomendações de todos os itens vistos durante o treino.
Adicione o conjunto de dados para o qual deseja fazer previsões e conecte-o ao Dataset para obter.
Se escolher a opção, de todos os itens, o conjunto de dados de entrada deverá ser composto por uma e apenas uma coluna, contendo os identificadores dos utilizadores para os quais devem fazer recomendações.
Se o conjunto de dados contiver mais de uma coluna, é levantado um erro. Utilize as Colunas Selecionais no módulo Dataset para remover colunas extras do conjunto de dados de entrada.
Se escolher a opção, a partir de itens classificados (para avaliação do modelo), o conjunto de dados de entrada deverá ser composto por pares de artigos de utilizador. A primeira coluna deve conter o identificador do utilizador . A segunda coluna deve conter os identificadores de item correspondentes.
O conjunto de dados pode incluir uma terceira coluna de classificações de artigos de utilizador, mas esta coluna é ignorada.
(Opcional). Se tiver um conjunto de dados de funcionalidades do utilizador, conecte-a às funcionalidades do Utilizador.
A primeira coluna do conjunto de dados das funcionalidades do utilizador deve conter o identificador do utilizador. As colunas restantes devem conter valores que caracterizam o utilizador, tais como o seu sexo, preferências, localização, etc.
As funcionalidades dos utilizadores que avaliaram os itens são ignoradas pelo Score Matchbox Recommender, porque estas funcionalidades já foram aprendidas durante o treino. Portanto, pode filtrar o seu conjunto de dados com antecedência para incluir apenas utilizadores de arranque a frio, ou utilizadores que não tenham avaliado quaisquer itens.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do utilizador, não é possível utilizar funcionalidades de aplicação durante a pontuação.
(Opcional) Se tiver um conjunto de funcionalidades de item, pode conectá-lo às funcionalidades do Item.
A primeira coluna do conjunto de dados do item deve conter o identificador de produto. As colunas restantes devem conter valores que caracterizam os itens.
As características dos itens classificados são ignoradas pelo Score Matchbox Recommender, porque estas funcionalidades já foram aprendidas durante o treino. Portanto, pode restringir o seu conjunto de dados de pontuação a itens de arranque a frio, ou itens que não tenham sido avaliados por nenhum utilizadores.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do item, não utilize as funcionalidades do item ao marcar.
Número máximo de itens a recomendar a um utilizador: Digite o número de itens a devolver para cada utilizador. Por predefinição, são recomendados 5 itens.
Tamanho mínimo do conjunto de recomendações por utilizador: Escreva um valor que indique quantas recomendações prévias são necessárias. Por predefinição, este parâmetro é definido para 2, o que significa que o item deve ter sido recomendado por pelo menos dois outros utilizadores.
Esta opção só deve ser utilizada se estiver a pontuar no modo de avaliação. A opção não está disponível se selecionar de todos os itens.
Execute a experimentação.
Resultados da recomendação do artigo
O conjunto de dados pontuado devolvido pelo Score Matchbox Recommender lista os itens recomendados para cada utilizador.
- A primeira coluna contém os identificadores do utilizador.
- São geradas várias colunas adicionais, dependendo do valor definido para o número máximo de itens a recomendar a um utilizador. Cada coluna contém um item recomendado (por identificador). As recomendações são ordenadas pela afinidade do artigo do utilizador, com o item com maior afinidade colocado na coluna, Ponto 1.
Aviso
Este conjunto de dados pontuado não pode ser avaliado utilizando o módulo De Avaliação De recomendor .
Localizar utilizadores relacionados
A opção de encontrar utilizadores relacionados é útil se estiver a recomendar "pessoas como você", ou se estiver a criar um conjunto de utilizadores semelhantes para basear outros tipos de previsões.
Adicione um modelo de recomendação treinado à sua experiência e conecte-o ao recomendador de Matchbox treinado. Tem de criar o modelo utilizando o Recomendador train Matchbox.
Tipo de previsão de recomendação: Selecione Utilizadores Relacionados.
Seleção do utilizador relacionado: Indique como vai utilizar o modelo para pontuar e especifique o conjunto de utilizadores para basear as pontuações da seguinte forma:
De todos os Utilizadores: Selecione esta opção se estiver a configurar uma experiência para utilizar num serviço web ou produção, ou se precisar de fazer previsões para novos utilizadores. Esta opção permite o modo de produção, e o módulo baseia a sua recomendação apenas nos utilizadores vistos durante o treino.
A partir de Utilizadores que avaliaram itens (para avaliação de modelos): Selecione esta opção se estiver a desenvolver ou testar um modelo. Esta opção permite o modo de avaliação, e o modelo baseia as suas recomendações nos utilizadores do conjunto de testes que avaliaram alguns itens comuns.
Ligação um conjunto de dados que contém os utilizadores para os quais gerar previsões. O formato deste conjunto de dados depende se está a utilizar o módulo de pontuação no modo de produção ou no modo de avaliação.
Modo de produção, utilizando de todos os itens
O conjunto de dados para pontuação deve ser composto por utilizadores para os quais deseja encontrar utilizadores relacionados. A primeira e única coluna deve conter os identificadores do utilizador. Se outras colunas estiverem incluídas, um erro é levantado. Utilize as Colunas Selecionadas no módulo Dataset para remover colunas desnecessárias.
Modo de avaliação, utilizando itens classificados (para avaliação de modelos)
O conjunto de dados para pontuar deve ser composto por 2-3 colunas, contendo pares de artigos de utilizador. A primeira coluna deve conter identificadores de utilizador. A segunda coluna deve conter identificadores de item. O conjunto de dados pode incluir uma terceira coluna de classificações (pelo utilizador na coluna 1 para o item na coluna 2), mas a coluna de classificações será ignorada.
Número máximo de utilizadores relacionados a encontrar para um utilizador: Escreva um número que indique o número máximo de previsões desejada para cada utilizador. O padrão é 5, o que significa que no máximo cinco utilizadores relacionados podem ser devolvidos, mas em alguns casos pode haver menos de 5.
No modo de avaliação (dos utilizadores que avaliaram os itens), configuure estes parâmetros adicionais:
Número mínimo de itens que o utilizador de consulta e o utilizador relacionado devem ter classificado em comum: Este valor estabelece um limiar para recomendações. O número que digita representa o número mínimo de itens que o utilizador-alvo e o utilizador potencial relacionado devem ter avaliado. O valor predefinido é 2, o que significa que, no mínimo, dois itens devem ter sido avaliados por ambos os utilizadores.
Tamanho mínimo do conjunto de utilizadores relacionado para um único utilizador: Este valor controla o número mínimo de utilizadores similares necessários para criar uma recomendação. Por padrão, o valor é 2, o que significa que se tiver apenas dois utilizadores que estejam relacionados em virtude da classificação dos mesmos itens, pode considerá-los relacionados e gerar uma recomendação.
(Opcional). Se tiver um conjunto de dados de funcionalidades do utilizador, conecte-a às funcionalidades do Utilizador.
A primeira coluna do conjunto de dados das funcionalidades do utilizador deve conter o identificador do utilizador. As colunas restantes devem conter valores que caracterizam o utilizador, tais como sexo, preferências, localização, etc.
As funcionalidades dos utilizadores que avaliaram os itens são ignoradas pelo Score Matchbox Recommender , uma vez que estas funcionalidades já foram aprendidas durante o treino. Por isso, filtre previamente o seu conjunto de dados para incluir apenas utilizadores de arranque a frio ou utilizadores que não tenham avaliado quaisquer itens.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do utilizador, não é possível aplicar as funcionalidades do utilizador durante a pontuação.
(Opcional) Se tiver um conjunto de funcionalidades de item, conecte-o às funcionalidades do Item.
A primeira coluna do conjunto de dados do item deve conter o identificador de produto. As colunas restantes devem conter valores que caracterizam os itens.
As características dos itens classificados são ignoradas pelo Score Matchbox Recommender , uma vez que estas funcionalidades já foram aprendidas durante o treino. Portanto, pode restringir o seu conjunto de dados de pontuação a itens de arranque a frio, ou itens que não tenham sido avaliados por nenhum utilizadores.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do item, não utilize as funcionalidades do item ao marcar.
Execute a experimentação.
Resultados para utilizadores relacionados
O conjunto de dados pontuado devolvido pelo Score Matchbox Recommender lista os utilizadores que estão relacionados com cada utilizadores no conjunto de dados de entrada.
Para cada utilizador especificado no conjunto de dados de entrada, o conjunto de dados de resultados contém um conjunto de utilizadores relacionados.
A primeira coluna contém o identificador do utilizador-alvo (o utilizador fornecido como entrada).
São geradas colunas adicionais que contêm os identificadores dos utilizadores relacionados. O número de colunas adicionais depende do valor definido na opção, número máximo de utilizadores relacionados a encontrar para um utilizador.
Os utilizadores relacionados são encomendados pela força da relação com o utilizador-alvo, com o utilizador mais fortemente relacionado na coluna, O Utilizador Relacionado 1.
Encontre itens relacionados
Ao prever itens relacionados, pode gerar recomendações para utilizadores com base em itens que já foram avaliados.
Adicione um modelo de recomendação treinado à sua experiência e conecte-o ao recomendador de Matchbox treinado. Tem de criar o modelo utilizando o Recomendador train Matchbox.
Tipo de previsão de recomendação: Selecione Itens Relacionados.
Ligação um conjunto de dados que contém os utilizadores para os quais gerar previsões. O formato deste conjunto de dados depende se está a utilizar o módulo de pontuação no modo de produção ou no modo de avaliação.
Modo de produção, utilizando de todos os itens
O conjunto de dados para pontuar deve ser composto por itens para os quais deseja encontrar utilizadores relacionados.
A primeira e única coluna deve conter os identificadores de item. Se outras colunas estiverem incluídas, um erro é levantado. Utilize as Colunas Selecionadas no módulo Dataset para remover colunas desnecessárias.
Modo de avaliação, utilizando itens classificados (para avaliação de modelos)
O conjunto de dados para pontuar deve ser composto por 2-3 colunas, contendo pares de artigos de utilizador. A primeira coluna deve conter identificadores de utilizador. A segunda coluna deve conter identificadores de item.
O conjunto de dados pode incluir uma terceira coluna de classificações (pelo utilizador na coluna 1 para o item na coluna 2), mas a coluna de classificações é ignorada.
Número máximo de itens relacionados a encontrar para um item>: Digite um número que indique o número máximo de previsões deseja para cada item.
O padrão é 5, o que significa que no máximo cinco itens relacionados podem ser devolvidos, mas pode haver menos de 5.
Se estiver a utilizar o modo de avaliação (dos utilizadores que avaliaram os itens), configuure estes parâmetros adicionais:
O número mínimo de itens que o item de consulta e o item relacionado devem ter sido avaliados em comum: Este valor estabelece um limiar para recomendações. O número que digita representa o número mínimo de itens que foram avaliados pelo utilizador-alvo e por algum utilizador relacionado. O valor predefinido é 2, o que significa que, no mínimo, dois itens devem ter sido avaliados pelo utilizador-alvo e pelo utilizador relacionado.
Tamanho mínimo do conjunto de artigos relacionados para um único item: Este valor controla o número mínimo de itens semelhantes necessários para criar uma recomendação. Por padrão, o valor é 2, o que significa que, se tiver apenas dois itens relacionados em virtude de ter sido avaliado pelos mesmos utilizadores, pode considerá-los relacionados e gerar uma recomendação.
(Opcional). Se tiver um conjunto de dados de funcionalidades do utilizador, conecte-a às funcionalidades do Utilizador.
A primeira coluna do conjunto de dados das funcionalidades do utilizador deve conter o identificador do utilizador. As colunas restantes devem conter valores que caracterizam o utilizador, tais como o seu sexo, preferências, localização, etc.
As funcionalidades dos utilizadores que avaliaram os itens são ignoradas pelo Score Matchbox Recommender, porque estas funcionalidades já foram aprendidas durante o treino. Portanto, pode filtrar o seu conjunto de dados com antecedência para incluir apenas utilizadores de arranque a frio, ou utilizadores que não tenham avaliado quaisquer itens.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do utilizador, não é possível aplicar as funcionalidades do utilizador durante a pontuação.
(Opcional) Se tiver um conjunto de funcionalidades de item, pode conectá-lo às funcionalidades do Item.
A primeira coluna do conjunto de dados do item deve conter o identificador de produto. As colunas restantes devem conter valores que caracterizam o item.
As características dos itens classificados são ignoradas pelo Score Matchbox Recommender, porque estas funcionalidades já foram aprendidas durante o treino. Portanto, pode restringir o seu conjunto de dados de pontuação a itens de arranque a frio, ou itens que não tenham sido avaliados por nenhum utilizadores.
Aviso
Se o modelo foi treinado sem utilizar as funcionalidades do item, não utilize as funcionalidades do item ao marcar.
(Opcional) Numa experiência preditiva, pode utilizar uma quinta porta de entrada, denominada Training Dataset, para remover os utilizadores existentes que foram incluídos nos dados de treino do modelo a partir dos resultados da previsão.
Para aplicar este filtro, ligue o conjunto de dados de treino original à porta de entrada.
Execute a experimentação.
Resultados de itens relacionados
O conjunto de dados pontuado devolvido pelo Score Matchbox Recommender lista os itens relacionados para cada item no conjunto de dados de entrada.
A primeira coluna contém o identificador do item-alvo (o item fornecido como entrada).
São geradas colunas adicionais que contêm os identificadores de itens relacionados. O número de colunas adicionais depende do valor definido na opção, número máximo de itens relacionados para encontrar para um item.
Os itens relacionados são encomendados pela força da relação com o item alvo, com o item mais fortemente relacionado na coluna, o Item 1 Relacionado.
Notas técnicas
Esta secção contém respostas a algumas perguntas comuns sobre a utilização do recomendador para criar previsões.
Utilizadores e recomendações de arranque a frio
Normalmente, para criar recomendações, o módulo 'Recomendador's Score Matchbox requer as mesmas entradas que utilizou durante o treino do modelo, incluindo um ID do utilizador. Isto porque o algoritmo precisa de saber se aprendeu algo sobre este utilizador durante o treino.
No entanto, para os novos utilizadores, pode não ter um ID do utilizador, apenas algumas funcionalidades do utilizador, como idade, sexo, etc.
Ainda pode criar recomendações para os utilizadores que sejam novos no seu sistema, manuseando-os como utilizadores de arranque a frio. Para estes utilizadores, o algoritmo de recomendação não utiliza o histórico passado ou as classificações anteriores, apenas as funcionalidades do utilizador.
Para efeitos de previsão, um utilizador de arranque a frio é definido como um utilizador com um ID que não foi utilizado para o treino. Para garantir que os IDs não correspondem aos IDs utilizados no treino, pode criar novos identificadores. Por exemplo, pode gerar IDs aleatórios dentro de um intervalo especificado, ou alocar uma série de IDs com antecedência para utilizadores de arranque a frio.
No entanto, se não tiver quaisquer dados de filtragem colaborativos, como um vetor de funcionalidades do utilizador, é melhor utilizar um aprendiz de classificação ou regressão.
Utilização de produção do recomendador Matchbox
Se tiver experimentado com o recomendador Matchbox e, em seguida, mover o modelo para a produção, esteja ciente destas diferenças fundamentais ao utilizar o recomendador no modo de avaliação e no modo de produção:
A avaliação, por definição, requer previsões que podem ser verificadas contra a verdade no solo num conjunto de testes. Por isso, quando avaliar o recomendador, deve prever apenas itens que tenham sido classificados no conjunto de testes. Isto restringe necessariamente os valores possíveis que são previstos.
No entanto, quando operacionaliza o modelo, normalmente muda-se o modo de previsão para fazer recomendações com base em todos os itens possíveis, de forma a obter as melhores previsões. Para muitas destas previsões, não existe uma verdade de base correspondente, pelo que a exatidão da recomendação não pode ser verificada da mesma forma que durante a experimentação.
Se não fornecer um ID de utilizador em produção, e fornecer apenas um vetor de recurso, poderá obter como resposta uma lista de todas as recomendações para todos os utilizadores possíveis. Certifique-se de fornecer uma identificação do utilizador.
Para limitar o número de recomendações que são devolvidas, também pode especificar o número máximo de itens devolvidos por utilizador.
Não é possível gerar previsões apenas para itens que não tenham sido avaliados anteriormente. Esta ação é propositada.
A razão é que, para recomendar apenas os itens que não foram avaliados, o recomendador precisaria de armazenar todo o conjunto de dados de treino com o modelo, o que aumentaria a sua utilização de armazenamento.
Se quiser recomendar apenas itens que não tenham sido vistos pelo seu utilizador, pode solicitar mais itens para recomendar e, em seguida, filtrar manualmente os classificados.
Atualização contínua do recomendador
A atualização online (ou formação contínua) de um modelo de recomendação não é suportada atualmente em Machine Learning. Se pretender capturar as respostas do utilizador às recomendações e usá-las para melhorar o modelo, sugerimos a reconversão do modelo completo periodicamente. A formação incremental não é possível, mas pode aplicar uma janela deslizante aos dados de formação para garantir que o volume de dados é minimizado durante a utilização dos dados mais recentes.
Entradas esperadas
Nome | Tipo | Description |
---|---|---|
Recomendador de Matchbox treinado | ILearner | Recomendador de Matchbox treinado |
Conjunto de dados para pontuar | Tabela de Dados | Conjunto de dados para pontuar |
Funcionalidades do utilizador | Tabela de Dados | Conjunto de dados que contém funcionalidades que descrevem os utilizadores Estes dados são opcionais |
Características do item | Tabela de Dados | Conjunto de dados que contém funcionalidades que descrevem itens Estes dados são opcionais |
Parâmetros do módulo
Nome | Intervalo | Tipo | Predefinição | Description |
---|---|---|---|---|
Tipo de previsão recomendador | Lista | Tipo de previsão | Recomendação do artigo | Especificar o tipo de previsão que o recomendador deve fazer |
Seleção de artigos recomendados | Lista | Seleção de artigos | A partir de Itens Avaliados (para avaliação de modelos) | Selecione o conjunto de itens para fazer recomendações a partir de |
Seleção de utilizadores relacionada | Lista | Seleção do utilizador | Dos utilizadores que avaliaram os itens (para avaliação de modelos) | Selecione o conjunto de utilizadores a utilizar ao encontrar itens relacionados |
Seleção de artigos relacionados | Lista | [Seleção de artigos | A partir de Itens Avaliados (para avaliação de modelos) | Selecione o conjunto de itens a utilizar ao encontrar itens relacionados |
Saídas
Nome | Tipo | Description |
---|---|---|
Conjunto de dados pontuado | Tabela de Dados | Conjunto de dados pontuado |
Exceções
Exceção | Description |
---|---|
Erro 0022 | A exceção ocorre se o número de colunas selecionadas no conjunto de dados de entrada não for igual ao número esperado. |
Erro 0036 | A exceção ocorre se vários vetores de recurso foram fornecidos para um determinado utilizador ou item. |
Erro 0013 | A exceção ocorre se a aprovação para o aprendiz de módulo tem um tipo inválido. |
Erro 0035 | A exceção ocorre se não forem fornecidas funcionalidades para um determinado utilizador ou item. |
Erro 0053 | A exceção ocorre no caso de não existirem funcionalidades ou itens do utilizador para recomendações da Matchbox. |
Erro 0003 | A exceção ocorre se uma ou mais entradas forem nulas ou vazias. |
Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.
Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.
Ver também
Recomendador da caixa de fósforos do comboio
Avaliar Recomendador
Pontuação