Escolher e mapear dados de testes modelo
Para criar um gráfico de precisão no Analysis Services, você deve escolher os dados que serão usados para testar o modelo e mapear os dados para o modelo.
Por padrão, o Analysis Services usará os dados de teste do modelo de mineração, desde que você tenha criado um conjunto de dados de retenção ao criar a estrutura de mineração. A criação de um conjunto de testes de controle é a maneira mais fácil de testar modelos baseados na mesma estrutura de mineração porque os nomes de colunas e os tipos de dados sempre coincidirão com o modelo. Além disso, você tem uma garantia razoável de que a distribuição dos dados é semelhante. Somado a isso, o designer criará automaticamente as relações entre as colunas de entrada e saída.
Outra alternativa é especificar uma fonte de dados externa. Para dados externos, há alguns requisitos adicionais:
O conjunto de dados externo deve ser definido como uma exibição de fonte de dados em uma instância do Analysis Services.
O conjunto de dados externos deve conter pelo menos uma coluna que possa ser mapeada para a coluna previsível no modelo de mineração. Você pode optar por ignorar algumas colunas.
Você não pode adicionar novas colunas nem mapear colunas em uma exibição de fonte de dados diferente. A exibição da fonte de dados selecionada deve conter todas as colunas que você precisa para a consulta de previsão.
Se os nomes da coluna externa coincidirem exatamente com os nomes no modelo, o designer irá mapeá-los para você. Se os mapeamentos estiverem errados, você poderá alterá-los, ou excluir e criar novos mapeamentos para colunas existentes.
Se você usar uma fonte de dados externa, poderá aplicar filtros para restringir os dados de testes a um subconjunto relevante de casos.
Mesmo ao usar o conjunto de testes de controle, lembre-se de que filtros podem causar diferenças entre os dados de testes associados com uma estrutura de mineração e os casos de testes do modelo de mineração.
Este tópico descreve como escolher e mapear dados de testes:
Selecione tabelas de entrada para testar a precisão de um modelo de mineração
Mapeie colunas modelo para as colunas nos dados de testes
Altere a forma como colunas nos dados de testes são mapeadas para o modelo
Para selecionar tabelas de entrada para testar a exatidão de um modelo de mineração
No Designer de Mineração de Dados no SSDT (SQL Server Data Tools), clique duas vezes na estrutura de mineração que contém os modelos que você deseja mapear.
Selecione a guia Gráfico de Precisão de Mineração .
Na Guia Seleção de Entrada da exibição Gráfico de Precisão de Mineração , selecione uma das seguintes opções:
Usar casos de teste do modelo de mineração
Usar casos de teste da estrutura de mineração
Especificar um conjunto de dados diferente
Se você selecionou Especificar um conjunto de dados diferente, opcionalmente, clique em Abrir Editor de Filtro para criar condições de filtro no conjunto de dados de entrada. Clique em OK.
Clique na guia Gráfico de Comparação de Precisão ou na guia Matriz de Classificação para criar automaticamente o gráfico usando os dados de teste recém-especificados.
Para mapear colunas modelo para as colunas nos dados de testes
Clique duas vezes na estrutura de mineração que contém os modelos que você deseja incluir no gráfico, para abrir a estrutura e seus modelos no Designer de Mineração de Dados.
Selecione a guia Gráfico de Precisão da Mineração e, em seguida, selecione a guia Seleção de Entrada .
Na guia Seleção de Entrada , em Selecionar conjunto de dados a ser usado para Gráfico de Precisão, selecione Especificar um conjunto de dados diferente.
Clique no botão Procurar (...) para abrir uma caixa de diálogo e criar a definição do conjunto de dados externo.
Na caixa de diálogo Selecionar Estrutura de Mineração , selecione a estrutura de mineração que contém os modelos com os quais deseja trabalhar e, em seguida, clique em OK.
Na tabela Selecionar Tabela(s) de Entrada da guia Gráfico de Precisão de Mineração , clique em Selecionar Tabela de Casos para abrir a caixa de diálogo Selecionar Tabela .
Na caixa de diálogo Selecionar Tabela , selecione uma fonte de dados na lista Fonte de Dados . Escolha uma tabela que contém os dados que deseja usar nas consultas de previsão para determinar a precisão dos modelos.
Na caixa Nome de Tabela/Exibição , selecione a tabela que contém os dados que deseja usar para testar os modelos.
Edite os mapeamentos, se necessário. As colunas da estrutura de mineração são mapeadas automaticamente para colunas com o mesmo nome na tabela de entrada. Para criar mapeamentos manualmente, clique em uma coluna na tabela Selecionar Tabela(s) de Entrada e arraste-a na coluna correspondente na tabela Estrutura de Mineração . Para excluir um mapeamento, clique na linha que vincula a coluna na tabela Estrutura de Mineração à coluna mapeada na tabela Selecionar Tabela(s) de Entrada e pressione DELETE.
Clique em OK.
Para modificar a forma como dados de entrada são mapeados para o modelo
No Designer do Data Mining, clique duas vezes na estrutura que contém os modelos com os quais deseja criar o gráfico.
Selecione a guia Gráfico de Precisão de Mineração .
Clique na guia Seleção de Entrada .
Em Selecionar conjunto de dados a ser usado para Gráfico de Precisão, selecione a opção Especificar um conjunto de dados diferente.
Clique no botão Procurar (...) para abrir uma caixa de diálogo e criar a definição da fonte de dados externa.
Na caixa de diálogo Especificar Mapeamento de Coluna , clique em Selecionar Tabela de Casos.
Na caixa de diálogo Selecionar Tabela, selecione uma fonte de dados na lista e a tabela que contém os dados de caso. Clique em OK.
Se a tabela necessária não estiver disponível, feche a caixa de diálogo e crie uma nova exibição da fonte de dados que contenha a tabela. Para obter informações sobre como criar uma exibição de fonte de dados, consulte Definindo uma exibição de fonte de dados (Analysis Services).
Se o modelo de mineração tiver uma tabela aninhada, clique em Selecionar Tabela Aninhadae selecione a tabela aninhada na lista de tabelas na exibição da fonte de dados. Clique em OK.
Selecione a linha de junção do mapeamento que você quer modificar e, depois, Modificar Conexões.
A caixa de diálogo Modificar Mapeamento abre. Na tabela nessa caixa de diálogo, Colunas de Estrutura de Mineração lista cada coluna que a estrutura de mineração selecionada contém, e Colunas da tabela lista as colunas das tabelas de entrada que estão mapeadas para colunas na estrutura de mineração.
Em Coluna da Tabela, selecione a linha que corresponde à linha em Colunas de Estrutura de Mineração para a qual você deseja modificar uma relação. Selecione uma nova coluna ou a entrada em branco na lista para excluir a coluna.
Clique em OK.
Os mapeamentos das novas colunas são exibidos na caixa de diálogo Especificar Mapeamento de Coluna . Você pode remover um mapeamento selecionando a linha entre as colunas e pressionando a tecla DELETE. Você também pode criar uma nova conexão selecionando uma coluna na tabela Estrutura de Mineração e arrastando-a para a coluna correspondente na tabela Tabelas SelectInput .
Consulte Também
Tarefas de teste e validação e guias práticos (mineração de dados)