Exceções (Suplementos de Mineração de Dados do SQL Server)
de
Uma exceção significa um valor de dados problemático por qualquer um dos seguintes motivos:
O valor está fora do intervalo esperado.
Os dados talvez tenham sido inseridos incorretamente.
O valor está faltando.
Os dados consistem em um espaço ou outra cadeia de caracteres nula.
O valor é preciso, mas até agora está fora da distribuição, o que pode afetar significativamente o modelo.
O Cliente de Mineração de Dados para Excel o ajuda a detectar esses dados e atualiza ou elimina os valores. Por exemplo, você pode substituir exceções por uma média aritmética ou excluir linhas que contenham valores potencialmente errados.
Manipulando exceções
O assistente Remover Exceções oferece várias ferramentas para lidar com exceções adequadamente:
Primeiro, você pode explorar os dados para entender melhor a distribuição dos valores e a relação das exceções para outros dados.
Por exemplo, você pode usar a tarefa Explorar Dados para examinar e corrigir os valores. O assistente Remover Exceções também exibe um grafo, uma linha ou um gráfico de barras, para ajudá-lo a entender a distribuição de todos os valores.
Em seguida, você pode usar o assistente outliers para remover ou alterar exceções. O método usado depende se os valores são discretos ou contínuos.
O assistente exibe valores discretos em um gráfico de barras, no qual cada barra representa um valor específico, e a altura da barra indica o número de casos de cada valor. Ao deslizar o controle de limite no gráfico, você pode remover barras que representam grupos de valores potencial ou extremamente incorretos.
O assistente exibe valores contínuos em um gráfico de barras ou linha. No gráfico de linha, o valor é representado no eixo x e a contagem de valores no eixo y.
Você pode controlar se deseja remover ou manter valores nas extremidades baixa e alta do gráfico alterando os valores Mínimo e Máximo ou deslizando as barras. À medida que você altera as configurações de valores mínimo e máximo, os dados que serão suprimidos são mostrados pelo sombreamento no grafo.
Depois que você tiver selecionado com quais exceções trabalhar, informe ao assistente como manipular as exceções. Você pode excluir as linhas que contêm os valores de exceção ou especificar um valor de substituição, como um valor médio, nulo ou outro de sua escolha.
O assistente lhe dá algumas opções para exibir os novos dados. Você pode substituir os dados originais pelos novos valores, adicionar uma nova coluna à tabela que contém os novos valores ou criar uma nova planilha que contenha os dados atualizados.
Usando o Assistente de Exceções
Na faixa de opções Mineração de Dados , clique em Limpar Dados e selecione Exceções.
Na caixa de diálogo Selecionar Dados de Origem , selecione uma tabela de dados do Excel ou um intervalo de células e clique em Avançar.
Aviso
Não é possível usar o assistente outliers em dados externos, a menos que você o copie primeiro para o Excel.
Na caixa de diálogo Selecionar Coluna , selecione uma única coluna.
Clique em Próximo.
Na caixa de diálogo Especificar Limites , examine a distribuição de dados.
Se a coluna contiver valores discretos, o assistente exibirá um histograma contendo a contagem de cada valor discreto.
Supondo que exceções sejam valores raros, você pode filtrá-los alterando o valor Mínimo .
Se a coluna contiver dados numéricos, você poderá clicar no botão Exibir como Discreto ou no botão Exibir como Numérico para alternar entre exibir os valores em um gráfico de barras ou gráfico de linhas.
Na caixa de diálogo Especificar Limites , escolha o intervalo de dados que você deseja manter digitando um valor mínimo e máximo ou arrastando as barras de controle deslizante. Clique em Próximo.
Na caixa de diálogo Tratamento de Exceção , especifique se deseja que os valores sejam excluídos ou substituídos e clique em Avançar.
Na caixa de diálogo Selecionar Destino , especifique onde deseja que os novos dados sejam salvos.
Opções relacionadas
O assistente fornece as seguintes opções:
Opções | Comentário |
---|---|
Selecionar Coluna | Você pode trabalhar somente com uma coluna por vez. |
Especificar tratamento de limites | Defina um limite usando Mínimo para excluir valores encontrados em menos linhas do que o valor limite. Inicialmente, o valor em Mínimo é igual ao valor com menos linhas e você não pode fazer o mínimo menor que esse valor. |
Manipulação de Exceções | Se você decidir excluir exceções, poderá alterar os dados na planilha atual ou criar uma cópia dos dados em uma nova planilha. |
Consulte Também
Explorar dados (Suplementos de Mineração de Dados do SQL Server)