Partilhar via


Train Clustering Model (Preparar Modelo de Clustering)

Este artigo descreve um componente no designer do Azure Machine Learning.

Use este componente para treinar um modelo de clustering.

O componente usa um modelo de clustering não treinado que você já configurou usando o componente K-Means Clustering e treina o modelo usando um conjunto de dados rotulado ou não rotulado. O componente cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.

Nota

Um modelo de agrupamento não pode ser treinado usando o componente Train Model , que é o componente genérico para treinar modelos de aprendizado de máquina. Isso porque o Train Model trabalha apenas com algoritmos de aprendizagem supervisionada. K-means e outros algoritmos de agrupamento permitem a aprendizagem não supervisionada, o que significa que o algoritmo pode aprender com dados não rotulados.

Como usar o modelo Train Clustering

  1. Adicione o componente Train Clustering Model ao seu pipeline no designer. Você pode encontrar o componente em Componentes de Machine Learning, na categoria Trem .

  2. Adicione o componente K-Means Clustering ou outro componente personalizado que crie um modelo de clustering compatível e defina os parâmetros do modelo de clustering.

  3. Anexe um conjunto de dados de treinamento à entrada à direita do Train Clustering Model.

  4. Em Conjunto de colunas, selecione as colunas do conjunto de dados a serem usadas na criação de clusters. Certifique-se de selecionar colunas que façam bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos, ou colunas que tenham todos os mesmos valores.

    Se um rótulo estiver disponível, você pode usá-lo como um recurso ou deixá-lo de fora.

  5. Selecione a opção, Verificar se há acrescentar ou desmarcar apenas para o resultado, se quiser exportar os dados de treinamento junto com o novo rótulo de cluster.

    Se você desmarcar essa opção, somente as atribuições de cluster serão saídas.

  6. Envie o pipeline ou clique no componente Train Clustering Model e selecione Run Selected.

Resultados

Após a conclusão da formação:

  • Para salvar um instantâneo do modelo treinado, selecione a guia Saídas no painel direito do componente Modelo de trem . Selecione o ícone Registrar conjunto de dados para salvar o modelo como um componente reutilizável.

  • Para gerar pontuações a partir do modelo, use Atribuir dados a clusters.

Nota

Se você precisar implantar o modelo treinado no designer, certifique-se de que Atribuir dados a clusters em vez de Modelo de pontuação esteja conectado à entrada do componente Saída de serviço Web no pipeline de inferência.

Próximos passos

Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.