Assistente de Cluster (Suplementos de Mineração de Dados para Excel)
O assistente de Cluster ajuda a criar um modelo que detecta as linhas que têm características semelhantes e as agrupa para maximizar a distância entre grupos. Esse assistente é útil para localizar padrões em todos os tipos de dados.
O assistente de Cluster usa o algoritmo do Microsoft Clustering e pode ser extensivamente personalizado. Ele funciona em dados existentes de uma tabela do Excel, um intervalo do Excel ou uma consulta do Analysis Services. Funcionalidade semelhante é fornecida pela ferramenta Detectar Categorias , fornecida nas Ferramentas de Análise de Tabela para Excel. No entanto, a ferramenta Detectar Categorias não pode ser personalizada e deve usar dados nas tabelas do Excel.
Usando o assistente de Cluster
Na faixa de opções Mineração de Dados, clique em Cluster e em Avançar.
Na página Selecionar Dados de Origem, selecione uma tabela ou intervalo do Excel. Ou especifique uma fonte de dados externa.
Se você usar uma fonte de dados externa, poderá criar exibições personalizadas ou colar em texto de consulta personalizado e salvar o conjunto de dados como uma fonte de dados do Analysis Services.
Na página Clustering , você pode personalizar a maneira como o modelo é criado.
Para Número de segmentos, você pode instruir o assistente a criar um número fixo de categorias ou permitir que ele detecte automaticamente o número ideal de agrupamentos.
Examine a lista de colunas na lista Colunas de entrada e desmarque todas as colunas que não são úteis na criação de padrões. As colunas que você deve excluir incluem números de identificação, nomes de clientes e assim por diante.
Opcionalmente, clique em Parâmetros para alterar os parâmetros de algoritmo e personalizar o comportamento do modelo clustering.
Na página Dividir dados em conjuntos de treinamento e teste , especifique quantos dados manter para teste. O restante é sempre usado para treinar o modelo.
A configuração padrão é de 30% de dados para teste e 70% de dados para treinamento.
Na página Concluir , forneça um nome descritivo para o conjunto de dados e o modelo e defina as seguintes opções que controlam como você trabalha com o modelo concluído:
Procurar modelo. Quando essa opção é selecionada, assim que o assistente conclui o processamento do modelo, ele abre uma janela Procurar para ajudá-lo a explorar os resultados. O conteúdo do visualizador depende do tipo de modelo que você criou. Para obter mais informações, consulte Procurando um modelo de clustering.
Habilite o detalhamento. Selecione esta opção para visualizar os dados subjacentes do modelo finalizado. Essa opção estará disponível somente se você criar um modelo de Árvore de Decisão.
Use o modelo temporário. Se você selecionar esta opção, o modelo não será salvo no servidor. Os modelos temporários serão excluídos quando você fechar o Excel.
Mais sobre modelos de clustering
Você pode alterar o algoritmo de clustering usado por este assistente clicando em Avançado e usando a caixa de diálogo Parâmetros de Algoritmo.
O algoritmo Clustering da Microsoft fornece estes métodos de clustering:
K-means – escalonável ou não em escala.
Maximização de Expectativa (EM) - evolutiva ou não evolutiva.
Você também pode usar o parâmetro CLUSTER_SEED para controlar o valor inicial e garantir que os modelos repetidos que usam o mesmo conjunto de dados tenham os mesmos resultados.
Requisitos
Para usar o Assistente de cluster, você deve estar conectado a um banco de dados do Analysis Services. Para obter mais informações, consulte Conectar-se aos dados de origem (Cliente de Mineração de Dados para Excel).
Consulte Também
Criar um modelo de mineração de dados
Detectar Categorias (Ferramentas de Análise de Tabela para Excel)