Partilhar via


Classificar Recomendador SVD

Este artigo descreve como usar o componente Recomendação de pontuação SVD no designer do Azure Machine Learning. Use este componente para criar previsões usando um modelo de recomendação treinado com base no algoritmo de decomposição de valor único (SVD).

O recomendado SVD pode gerar dois tipos diferentes de previsões:

Ao criar o segundo tipo de previsões, você pode operar em um destes modos:

  • O modo de produção considera todos os usuários ou itens. Normalmente é usado em um serviço Web.

    Você pode criar pontuações para novos usuários, não apenas para usuários vistos durante o treinamento. Para obter mais informações, consulte as notas técnicas.

  • O modo de avaliação opera em um conjunto reduzido de usuários ou itens que podem ser avaliados. Normalmente é usado durante operações de oleoduto.

Para obter mais informações sobre o algoritmo de recomendação SVD, consulte o artigo de pesquisa Matrix factorization techniques for recommender systems.

Como configurar o Score SVD Recommender

Este componente suporta dois tipos de previsões, cada uma com requisitos diferentes.

Previsão de classificações

Quando você prevê classificações, o modelo calcula como um usuário reagirá a um item específico, dados de treinamento. Os dados de entrada para pontuação devem fornecer um usuário e o item a ser classificado.

  1. Adicione um modelo de recomendação treinado ao seu pipeline e conecte-o ao Trained SVD recommender. Você deve criar o modelo usando o componente Train SVD Recommender .

  2. Para Tipo de previsão de recomendação, selecione Previsão de classificação. Nenhum outro parâmetro é necessário.

  3. Adicione os dados para os quais você deseja fazer previsões e conecte-os ao Conjunto de dados para pontuar.

    Para que o modelo preveja classificações, o conjunto de dados de entrada deve conter pares de itens de usuário.

    O conjunto de dados pode conter uma terceira coluna opcional de classificações para o par usuário-item na primeira e na segunda colunas. Mas a terceira coluna será ignorada durante a previsão.

  4. Envie o pipeline.

Resultados para previsões de classificação

O conjunto de dados de saída contém três colunas: usuários, itens e a classificação prevista para cada usuário e item de entrada.

Recomendações para os utilizadores

Para recomendar itens para usuários, forneça uma lista de usuários e itens como entrada. A partir desses dados, o modelo usa seu conhecimento sobre itens existentes e usuários para gerar uma lista de itens com provável apelo para cada usuário. Você pode personalizar o número de recomendações retornadas. E você pode definir um limite para o número de recomendações anteriores necessárias para gerar uma recomendação.

  1. Adicione um modelo de recomendação treinado ao seu pipeline e conecte-o ao Trained SVD recommender. Você deve criar o modelo usando o componente Train SVD Recommender .

  2. Para recomendar itens para uma lista de usuários, defina Tipo de previsão de recomendação como Recomendação de item.

  3. Para Seleção de item recomendado, indique se você está usando o componente de pontuação na produção ou para avaliação do modelo. Escolha um destes valores:

    • Em Todos os itens: selecione esta opção se estiver configurando um pipeline para usar em um serviço Web ou em produção. Esta opção ativa o modo de produção. O componente faz recomendações a partir de todos os itens vistos durante o treinamento.

    • De Itens classificados (para avaliação do modelo): selecione esta opção se estiver desenvolvendo ou testando um modelo. Esta opção permite o modo de avaliação. O componente faz recomendações somente a partir dos itens no conjunto de dados de entrada que foram classificados.

    • De Itens sem classificação (para sugerir novos itens aos usuários): selecione esta opção se desejar que o componente faça recomendações apenas a partir dos itens do conjunto de dados de treinamento que não foram classificados.

  4. Adicione o conjunto de dados para o qual você deseja fazer previsões e conecte-o ao Conjunto de dados para pontuar.

    • Para From All Items, o conjunto de dados de entrada deve consistir em uma coluna. Ele contém os identificadores de usuários para os quais fazer recomendações.

      O conjunto de dados pode incluir duas colunas extras de identificadores de item e classificações, mas essas duas colunas são ignoradas.

    • Para From Rated Items (para avaliação do modelo), o conjunto de dados de entrada deve consistir em pares de itens de usuário. A primeira coluna deve conter o identificador do utilizador. A segunda coluna deve conter os identificadores de item correspondentes.

      O conjunto de dados pode incluir uma terceira coluna de classificações de item de usuário, mas essa coluna é ignorada.

    • Para De itens não classificados (para sugerir novos itens aos usuários), o conjunto de dados de entrada deve consistir em pares de itens de usuário. A primeira coluna deve conter o identificador do utilizador. A segunda coluna deve conter os identificadores de item correspondentes.

    O conjunto de dados pode incluir uma terceira coluna de classificações de item de usuário, mas essa coluna é ignorada.

  5. Número máximo de itens a recomendar a um utilizador: introduza o número de itens a devolver para cada utilizador. Por padrão, o componente recomenda cinco itens.

  6. Tamanho mínimo do pool de recomendações por usuário: insira um valor que indique quantas recomendações anteriores são necessárias. Por padrão, esse parâmetro é definido como 2, o que significa que pelo menos dois outros usuários recomendaram o item.

    Utilize esta opção apenas se estiver a pontuar no modo de avaliação. A opção não estará disponível se você selecionar De Todos os Itens ou De Itens Sem Classificação (para sugerir novos itens aos usuários).

  7. Para De itens não classificados (para sugerir novos itens aos usuários), use a terceira porta de entrada, chamada Dados de treinamento, para remover itens que já foram classificados dos resultados da previsão.

    Para aplicar esse filtro, conecte o conjunto de dados de treinamento original à porta de entrada.

  8. Envie o pipeline.

Resultados da recomendação de itens

O conjunto de dados de pontuação retornado pelo Score SVD Recommender lista os itens recomendados para cada usuário:

  • A primeira coluna contém os identificadores de usuário.
  • Um número de colunas adicionais são geradas, dependendo do valor que você definir para Número máximo de itens a recomendar a um usuário. Cada coluna contém um item recomendado (por identificador). As recomendações são ordenadas por afinidade de item de usuário. O item com maior afinidade é colocado na coluna Item 1.

Notas técnicas

Se você tiver um pipeline com o recomendado SVD e mover o modelo para produção, esteja ciente de que há diferenças importantes entre usar o recomendado no modo de avaliação e usá-lo no modo de produção.

A avaliação, por definição, requer previsões que podem ser verificadas contra a verdade do terreno em um conjunto de testes. Quando você avalia o recomendador, ele deve prever apenas os itens que foram classificados no conjunto de testes. Isso restringe os valores possíveis que são previstos.

Quando você operacionaliza o modelo, normalmente altera o modo de previsão para fazer recomendações com base em todos os itens possíveis, a fim de obter as melhores previsões. Para muitas dessas previsões, não há uma verdade de base correspondente. Portanto, a precisão da recomendação não pode ser verificada da mesma forma que durante as operações do gasoduto.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.