Partilhar via


Preparar Recomendador SVD

Este artigo descreve como usar o componente Train SVD Recommender no designer do Azure Machine Learning. Use este componente para treinar um modelo de recomendação baseado no algoritmo de decomposição de valor único (SVD).

O componente Train SVD Recommender lê um conjunto de dados de triplos de classificação de item do usuário. Ele retorna um recomendado SVD treinado. Em seguida, você pode usar o modelo treinado para prever classificações ou gerar recomendações, conectando o componente Recomendação de pontuação SVD .

Mais sobre modelos de recomendação e o recomendado SVD

O principal objetivo de um sistema de recomendação é recomendar um ou mais elementos aos utilizadores do sistema. Exemplos de um item podem ser um filme, restaurante, livro ou música. Um usuário pode ser uma pessoa, um grupo de pessoas ou outra entidade com preferências de item.

Existem duas abordagens principais para os sistemas de recomendação:

  • Uma abordagem baseada em conteúdo usa recursos para usuários e itens. Os usuários podem ser descritos por propriedades, como idade e sexo. Os itens podem ser descritos por propriedades como autor e fabricante. Você pode encontrar exemplos típicos de sistemas de recomendação baseados em conteúdo em sites de matchmaking social.
  • A filtragem colaborativa usa apenas identificadores dos usuários e dos itens. Ele obtém informações implícitas sobre essas entidades a partir de uma matriz (esparsa) de classificações dadas pelos usuários aos itens. Podemos aprender sobre um usuário a partir dos itens que eles classificaram e de outros usuários que classificaram os mesmos itens.

O recomendado SVD usa identificadores dos usuários e dos itens, e uma matriz de classificações dadas pelos usuários aos itens. É uma recomendação colaborativa.

Para obter mais informações sobre o recomendado SVD, consulte o artigo de pesquisa relevante: Matrix factorization techniques for recommender systems.

Como configurar o Train SVD Recommender

Preparar dados

Antes de usar o componente, os dados de entrada devem estar no formato esperado pelo modelo de recomendação. É necessário um conjunto de dados de treinamento de triplos de classificação de item do usuário.

  • A primeira coluna contém identificadores de usuário.
  • A segunda coluna contém identificadores de item.
  • A terceira coluna contém a classificação para o par usuário-item. Os valores de classificação devem ser do tipo numérico.

O conjunto de dados Classificações de Filmes no designer do Azure Machine Learning (selecione Conjuntos de Dados e, em seguida, Exemplos) demonstra o formato esperado:

Classificações de filmes

A partir deste exemplo, você pode ver que um único usuário classificou vários filmes.

Preparar o modelo

  1. Adicione o componente Train SVD Recommender ao seu pipeline no designer e conecte-o aos dados de treinamento.

  2. Para Número de fatores, especifique o número de fatores a serem usados com o recomendador.

    Cada fator mede o quanto o usuário está se relacionando com o item. O número de fatores é também a dimensionalidade do espaço fatorial latente. Com o aumento do número de usuários e itens, é melhor definir um número maior de fatores. Mas se o número for muito grande, o desempenho pode cair.

  3. O número de iterações do algoritmo de recomendação indica quantas vezes o algoritmo deve processar os dados de entrada. Quanto maior for este número, mais precisas são as previsões. No entanto, um número mais elevado significa uma formação mais lenta. O valor predefinido é 30.

  4. Para Taxa de aprendizagem, insira um número entre 0,0 e 2,0 que defina o tamanho da etapa para a aprendizagem.

    A taxa de aprendizagem determina o tamanho da etapa em cada iteração. Se o tamanho da etapa for muito grande, você pode ultrapassar a solução ideal. Se o tamanho do passo for muito pequeno, o treinamento leva mais tempo para encontrar a melhor solução.

  5. Envie o pipeline.

Resultados

Depois que o trabalho de pipeline for concluído, para usar o modelo para pontuação, conecte o Train SVD Recommender ao Score SVD Recommender, para prever valores para novos exemplos de entrada.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.