Criar um relatório de validação cruzada
Este tópico mostra passo-a-passo a criação de um relatório de validação cruzada usando a guia Gráfico de Precisão no Designer de Mineração de Dados. Para obter informações gerais sobre a aparência de um relatório de validação cruzada e as medidas estatísticas que ele inclui, consulte Validação cruzada (Analysis Services - Mineração de dados).
Um relatório de validação cruzada é bem diferente de um gráfico de precisão, como um gráfico de comparação de precisão ou uma matriz de classificação.
A validação cruzada avalia a distribuição geral de dados que são usados em um modelo ou estrutura; assim, você não especifica um conjunto de dados de teste. A validação cruzada sempre usa apenas os dados originais que foram usados para treinar o modelo ou a estrutura de mineração.
A validação cruzada só pode ser executada em relação a um único resultado previsível. Se a estrutura oferecer suporte a modelos com atributos previsíveis diferentes, crie relatórios separados para cada saída previsível.
Somente modelos relacionados à estrutura atual selecionada estão disponíveis para validação cruzada.
Se a estrutura selecionada no momento oferecer suporte a uma combinação de modelos de clustering e não clustering, quando você clicar em Obter Resultados, o procedimento armazenado de validação cruzada carregará automaticamente modelos que têm a mesma coluna previsível, e ignorará modelos de clustering que não compartilham o mesmo atributo previsível.
Você pode criar um relatório de validação cruzada em um modelo de clustering que não tem um atributo previsível somente quando a estrutura de mineração não oferece suporte a outros atributos previsíveis.
Selecionar uma estrutura de mineração
Abra o Designer de Mineração de Dados no SSDT (SQL Server Data Tools).
No Gerenciador de Soluções, abra o banco de dados que contém a estrutura ou o modelo para o qual você deseja criar um relatório.
Clique duas vezes na estrutura de mineração para abrir a estrutura e seus modelos relacionados no Designer de Mineração de Dados.
Clique na guia Gráfico de Precisão de Mineração.
Clique na guia Validação Cruzada.
Defina opções de validação cruzada
Na guia Validação Cruzada de Número de Partições, clique na seta para baixo para selecionar um número entre 1 e 10. O valor padrão é 10.
O Número de Partições representa o número de partições que serão criadas dentro do conjunto de dados original. Se você definir Número de Partições como 1, será usado o conjunto de treinamento sem particionamento.
Em Atributo de Destino, clique na seta para baixo e selecione uma coluna na lista. Se o modelo for um modelo de clustering, selecione #Cluster para indicar que o modelo não tem um atributo previsível. Note que o valor, #Cluster, está disponível somente quando a estrutura de mineração não oferece suporte a outros tipos de atributos previsíveis.
Você pode selecionar apenas um atributo previsível por relatório. Por padrão, todos os modelos relacionados que têm o mesmo atributo previsível são incluídos no relatório.
Em Máx. de Casos, digite um número grande o suficiente para fornecer um exemplo representativo dos dados quando eles forem divididos entre números especificados de dobras. Se o número for maior que a contagem de casos no conjunto de treinamento do modelo, todos os casos serão usados.
Se o conjunto de dados de treinamento for muito grande, a configuração do valor de Máx. de Casos limitará o número total de casos processados e permitirá que o relatório seja concluído mais rapidamente. Porém, você não deve definir Máx. de Casos como um valor muito baixo, pois pode haver dados insuficientes para validação cruzada.
Como opção, para Estado de Destino, digite o valor do atributo previsível que você quer modelar. Por exemplo, se a coluna [Bike Buyer] tiver dois valores possíveis, 1 (Sim) e 2 (Não), você poderá inserir o valor 1 para avaliar a precisão do modelo para apenas o resultado desejado.
Observação Se você não digitar um valor, a opção Limite de Destino não estará disponível e o modelo será avaliado por todos os valores possível do atributo previsível.
Como opção, em Limite de Destino, digite um número decimal entre 0 e 1 para especificar a probabilidade mínima que uma previsão deve ter para ser considerada precisa.
Para obter dicas adicionais sobre como definir limites de probabilidade, consulte Medidas no relatório de validação cruzada.
Clique em Obter Resultados.
Imprimir o relatório de validação cruzada
Clique com o botão direito do mouse no relatório completo na guia Validação Cruzada.
No menu de atalho, selecione Imprimir ou Visualizar Impressão para revisar o primeiro relatório.
Criar uma cópia do relatório no Microsoft Excel
Clique com o botão direito do mouse no relatório completo na guia Validação Cruzada.
No menu de atalho, selecione Selecionar Tudo.
Clique com o botão direito do mouse no texto selecionado e selecione Copiar.
Cole a seleção em uma pasta do Excel aberta. Se você usar a opção Colar, o relatório será colado no Excel como HTML, preservando a formatação de linhas e colunas. Se colar o relatório usando a opção Colar Especial para texto ou texto Unicode, o relatório será colado em um formato delimitado por linha.