Compartilhar via


Especificando um conjunto de dados de teste para a estrutura (Tutorial de mineração de dados básico)

Nas últimas telas do Assistente de Mineração de Dados, você dividirá seus dados entre um conjunto de teste e um conjunto de treinamento. Em seguida, dará um nome à sua estrutura e habilitará o detalhamento do modelo.

Especificando um conjunto de teste

A separação dos dados em conjuntos de treinamento e de teste na criação de uma estrutura de mineração possibilita a avaliação imediata da precisão dos modelos de mineração criados posteriormente. Para obter mais informações sobre conjuntos de teste, consulte Particionando dados em conjuntos de treinamento e teste (Analysis Services - Mineração de dados).

Para especificar o conjunto de teste

  1. Na página Criar Conjunto de Teste, para Porcentagem de dados de teste, mantenha o valor padrão 30.

  2. Em Número máximo de casos no conjunto de dados de teste, digite 1000.

  3. Clique em Avançar.

Especificando o detalhamento

O detalhamento pode ser habilitado em modelos e em estruturas. A caixa de seleção desta janela permite o detalhamento do modelo nomeado e que você recupere informações detalhadas dos casos do modelo usados para treiná-lo.

Se a estrutura de mineração subjacente também estiver configurada para permitir o detalhamento, você poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, inclusive colunas que não foram incluídas no modelo de mineração. Para obter mais informações, consulte Usando a análise nos modelos de mineração e nas estruturas de mineração (Analysis Services – Mineração de dados).

Para nomear o modelo e a estrutura e especificar o detalhamento

  1. Na página Concluindo o Assistente, em Nome de estrutura de mineração, digite Correspondência Destinada.

  2. Em Nome do modelo de mineração, digite TM_Decision_Tree.

  3. Marque a caixa de seleção Permitir detalhamento.

  4. Examine o painel Visualizar. Observe que somente as colunas selecionadas, como Chave, Entrada ou Previsível, são mostradas. As outras colunas selecionadas (como AddressLine1, por exemplo) não são usadas para a criação do modelo, mas estarão disponíveis na estrutura subjacente e podem ser consultadas após o processamento e a implantação do modelo.

  5. Clique em Concluir.