Compartilhar via


Módulos de clustering

Importante

O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.

A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).

A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.

este artigo descreve os módulos no Machine Learning Studio (clássico) que dão suporte à criação de modelos de clustering.

Observação

aplica-se a: somente Machine Learning Studio (clássico)

Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.

O que é clustering?

O clustering, no Machine Learning, é um método de agrupamento de pontos de dados em clusters semelhantes. Ele também é chamado de segmentação.

Ao longo dos anos, muitos algoritmos de clustering foram desenvolvidos. Quase todos os algoritmos de clustering usam os recursos de itens individuais para localizar itens semelhantes. Por exemplo, você pode aplicar o clustering para localizar pessoas semelhantes por demográficos. Você pode usar o clustering com a análise de texto para agrupar frases com tópicos ou opiniões semelhantes.

O clustering é chamado de técnica de aprendizado não supervisionado porque pode ser usado em dados sem rótulo. Na verdade, o clustering é uma primeira etapa útil para descobrir novos padrões e requer pouco conhecimento prévio sobre como os dados podem ser estruturados ou como os itens estão relacionados. O clustering é geralmente usado para explorar dados antes da análise com outros algoritmos de previsão.

Como criar um modelo de clustering

no Machine Learning Studio (clássico), você pode usar o clustering com dados rotulados ou sem rótulo.

  • Em dados sem rótulo, o algoritmo de clustering determina quais pontos de dados estão mais próximos em conjunto e cria clusters em um ponto central, ou em centróide. Em seguida, você pode usar a ID do cluster como um rótulo temporário para o grupo de dados.

  • Se os dados tiverem rótulos, você poderá usar o rótulo para orientar o número de clusters ou usar o rótulo como apenas outro recurso.

Depois de configurar o algoritmo de clustering, você o treina nos dados usando o modelo de clustering de treinamento ou os módulos de clustering de varredura .

Quando o modelo for treinado, use-o para prever a associação de cluster para novos pontos de dados. Por exemplo, se você usou clustering para agrupar clientes por meio de um comportamento de compra, você pode usar o modelo para prever o comportamento de compra de novos clientes.

Lista de módulos

A categoria clustering inclui este módulo:

  • Clustering k-means: configura e inicializa um modelo de clustering k-means.

Para usar um algoritmo de clustering diferente ou criar um modelo de clustering personalizado usando o R, consulte estes tópicos:

Exemplos

Para obter exemplos de clustering em ação, consulte a Galeria de ia do Azure.

Consulte estes artigos para obter ajuda sobre como escolher um algoritmo:

Confira também