Treinar Modelo de Clustering
Importante
O suporte para o Machine Learning Studio (clássico) terminará em 31 de agosto de 2024. É recomendável fazer a transição para o Azure Machine Learning até essa data.
A partir de 1º de dezembro de 2021, você não poderá criar recursos do Machine Learning Studio (clássico). Até 31 de agosto de 2024, você pode continuar usando os recursos existentes do Machine Learning Studio (clássico).
- Confira informações sobre como mover projetos de machine learning do ML Studio (clássico) para o Azure Machine Learning.
- Saiba mais sobre o Azure Machine Learning.
A documentação do ML Studio (clássico) está sendo desativada e pode não ser atualizada no futuro.
Treinar um modelo em cluster e atribui dados a partir do conjunto de treinamento para clusters
Categoria: Machine Learning/Treinar
Observação
Aplica-se a: Machine Learning Studio (clássico) somente
Módulos semelhantes do tipo "arrastar e soltar" estão disponíveis no designer do Azure Machine Learning.
Visão geral do módulo
Este artigo descreve como usar o módulo Treinar Modelo de Clustering no Machine Learning Studio (clássico) para treinar um modelo de clustering.
O módulo usa um modelo de clustering não treinado que você já configurou usando o módulo de cluster K-means e treina o modelo usando um conjunto de dados com ou sem rótulo. O módulo cria um modelo treinado que você pode usar para previsão e um conjunto de atribuições de cluster para cada caso nos dados de treinamento.
Observação
Um modelo de clustering não pode ser treinado usando o módulo Treinar Modelo , que é o módulo genérico para criar modelos de machine learning. Isso ocorre porque o módulo Treinar Modelo funciona apenas com algoritmos de aprendizado supervisionados. K-means e outros algoritmos de clustering possibilitam o aprendizado não supervisionado, o que significa que o algoritmo pode aprender com dados sem rótulos.
Como usar o módulo Treinar Modelo de Clustering
Adicione o módulo Treinar Modelo de Clustering ao seu experimento no Studio (clássico). Você pode encontrar esse módulo em Módulos de Machine Learning, na categoria Treinar.
Adicione o módulo cluster K-means, ou outro módulo personalizado que cria um modelo de clustering compatível, e defina os parâmetros do modelo de clustering.
Anexe um conjunto de dados de treinamento na entrada à direita do módulo Treinar Modelo de Clustering.
No Conjunto de Colunas, escolha as colunas do conjunto de dados que for usar na criação de clusters. Certifique-se de selecionar as colunas que tenham bons recursos: por exemplo, evite usar IDs ou outras colunas que tenham valores exclusivos ou que tenham os mesmos valores.
Se um rótulo está disponível, você pode usá-lo como um recurso ou deixá-lo de fora.
Selecione a opção Verificar Anexar ou Desmarcar Somente Resultado, se você quiser a saída dos dados de treinamento junto com o novo rótulo de cluster.
Somente as atribuições de cluster farão a saída se você não selecionar essa opção.
Execute o experimento ou clique no módulo Treinar Modelo de Clustering e selecione Executar Selecionado.
Resultados
Após a conclusão do treinamento:
Para exibir o cluster e sua separação em um grafo, clique com o botão direito do mouse na saída do conjunto de dados Resultados e selecione Visualizar.
O grafo representa os componentes principais do cluster, em vez dos valores reais. Consulte Análise de componente principal para obter mais informações.
Para exibir os valores no conjuntos de dados, adicione uma instância do módulo Converter em Conjuntos de Dados e conecte-a à saída do conjuntos de dados Resultados. Execute o módulo Converter em Conjuntos de Dados para obter uma cópia dos dados que você pode exibir ou baixar.
Para salvar o modelo treinado para uso posterior, clique com o botão direito do mouse no módulo, selecione Modelo treinado e clique em Salvar como Modelo Treinado.
Use Atribuir Dados a Clusters para gerar as pontuações do modelo.
Exemplos
Para ver um exemplo de como o clustering é usado no aprendizado de máquina, consulte o Galeria de IA do Azure:
Clustering: encontrar empresas semelhantes: demonstra como usar o clustering em atributos derivados de texto não estruturado.
Clustering: quantização de cores: demonstra como usar o clustering para encontrar cores relacionadas e reduzir o número de bits usados em imagens.
Clustering: agrupar dados iris: fornece um exemplo simples de clustering com base no conjunto de dados iris.
Entradas esperadas
Nome | Tipo | Descrição |
---|---|---|
Modelo não treinado | Interface ICluster | Modelo de clustering não treinado |
Dataset | Tabela de Dados | Fonte de dados de entrada |
Parâmetros do módulo
Nome | Intervalo | Type | Padrão | Descrição |
---|---|---|---|---|
Conjunto de colunas | any | ColumnSelection | Padrão de seleção de coluna | |
Marque para anexar ou desmarque para somente resultado | any | Boolean | true | Se o conjunto de dados de saída tiver de conter o conjunto de dados de entrada anexado por coluna de atribuições (marcado) ou somente colunas de atribuições (desmarcado) |
Saídas
Nome | Tipo | Descrição |
---|---|---|
Modelo treinado | Interface ICluster | Modelo de clustering treinado |
Conjunto de dados de resultados | Tabela de Dados | Conjunto de dados de entrada anexado por coluna de dados de atribuições ou somente coluna de atribuições |
Exceções
Exceção | Descrição |
---|---|
Erro 0003 | Ocorrerá uma exceção se uma ou mais das entradas for nula ou estiver vazia. |
Para ver uma lista de erros específicos dos módulos do Studio (clássico), consulte Machine Learning Códigos de erro.
Para ver uma lista de exceções de API, consulte Machine Learning códigos de erro da API REST.
Confira também
Lista de Módulo A-Z
Treinamento
Atribuir Dados a Clusters
Cluster K-Means