Módulos de agrupamento
Importante
O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.
A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).
- Consulte informações sobre projetos de machine learning em movimento de ML Studio (clássico) para Azure Machine Learning.
- Saiba mais sobre Azure Machine Learning.
A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.
Este artigo descreve os módulos em Machine Learning Studio (clássico) que suportam a criação de modelos de clustering.
Nota
Aplica-se a: Machine Learning Studio (clássico) apenas
Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.
O que é o clustering?
O agrupamento, na aprendizagem automática, é um método de agrupamento de dados em aglomerados semelhantes. Também é chamado de segmentação.
Ao longo dos anos, muitos algoritmos de agrupamento foram desenvolvidos. Quase todos os algoritmos de agrupamento usam as características de itens individuais para encontrar itens semelhantes. Por exemplo, pode aplicar agrupamentos para encontrar pessoas semelhantes por demografia. Você pode usar o agrupamento com análise de texto para agrupar frases com tópicos ou sentimentos semelhantes.
O agrupamento é chamado de técnica de aprendizagem não supervisionada porque pode ser usado em dados não rotulados. Na verdade, o agrupamento é um primeiro passo útil para a descoberta de novos padrões, e requer pouco conhecimento prévio sobre como os dados podem ser estruturados ou como os itens estão relacionados. O agrupamento é frequentemente usado para a exploração de dados antes da análise com outros algoritmos mais preditivos.
Como criar um modelo de agrupamento
Em Machine Learning Studio (clássico), pode utilizar o agrupamento com dados rotulados ou não rotulados.
Em dados não rotulados, o algoritmo de agrupamento determina quais os pontos de dados mais próximos em conjunto, e cria clusters em torno de um ponto central, ou centroid. Em seguida, pode utilizar o ID do cluster como uma etiqueta temporária para o grupo de dados.
Se os dados ílpares utilizadores, pode utilizar a etiqueta para acionar o número de agrupamentos ou utilizar o rótulo como mais uma característica.
Depois de configurar o algoritmo de agrupamento, treina-o em dados utilizando os módulos de Clustering De Trem ou de Agrupamento de Varreduras .
Quando o modelo for treinado, use-o para prever a adesão ao cluster para novos pontos de dados. Por exemplo, se já utilizou o agrupamento para agrupar clientes através da compra de comportamentos, pode usar o modelo para prever o comportamento de compra de novos clientes.
Lista de módulos
A categoria de agrupamento inclui este módulo:
- K-Significa Clustering: Configura e iniciaisiza um modelo de agrupamento K-significa.
Tarefas relacionadas
Para utilizar um algoritmo de clustering diferente, ou criar um modelo de agrupamento personalizado utilizando R, consulte estes tópicos:
Exemplos
Por exemplo, agrupando-se em ação, consulte a Galeria Azure AI.
Consulte estes artigos para ajudar a escolher um algoritmo:
Folha de batota de algoritmo de aprendizagem automática para Machine Learning Studio (clássico)
Fornece um gráfico de decisão gráfico para guiá-lo através do processo de seleção.
Como escolher algoritmos Machine Learning para agrupamento, classificação ou regressão
Explica em maior detalhe os diferentes tipos de algoritmos de aprendizagem automática e como são usados.