Personalizando um modelo de mineração de dados (Analysis Services – Mineração de dados)
Depois de selecionar um algoritmo que atende as necessidades do seu negócio, é possível personalizar o modelo de mineração das formas a seguir para melhorar potencialmente os resultados.
Use colunas diferentes de dados no modelo ou altere os uso ou tipos de conteúdo das colunas.
Crie filtros no modelo de mineração para restringir os dados usados para treinar o modelo.
Defina parâmetros de algoritmo para controlar limites, divisões de árvore e outras condições.
Altere o algoritmo padrão que é usado para analisar dados ou fazer previsões.
Alterando os dados usados pelo modelo
As decisões relacionadas a quais colunas de dados serão usadas no modelo e como usar e processar os dados podem afetar consideravelmente os resultados da análise. Os tópicos a seguir fornecem informações para ajudá-lo a entender essas escolhas.
Modelos de mineração (Analysis Services – Mineração de Dados)
Fornece uma visão geral da arquitetura de um modelo de mineração, incluindo a estrutura de mineração subjacente e a escolha das colunas de mineração.
Criando filtros para modelos de mineração (Analysis Services - Mineração de dados)
Explica como você pode criar filtros adequados a um modelo de mineração para criar modelos com base em um subconjunto de dados da estrutura de mineração.
Seleção de recursos em mineração de dados.
Explica como o Analysis Services usa um processo chamado seleção de recursos para selecionar apenas os atributos mais úteis para serem adicionados a um modelo. A redução do número de colunas e atributos pode melhorar o desempenho e a qualidade do modelo. Os métodos de seleção de recursos disponíveis diferem de acordo com o algoritmo escolhido.
Se você usar o Assistente para Mineração de Dados, o Analysis Services poderá selecionar, automaticamente, os dados mais úteis para criar um determinado modelo.
Personalizando as configurações do algoritmo
A escolha do algoritmo determina que tipo de resultados você terá. Para obter informações gerais sobre como um algoritmo específico funciona ou sobre os cenários de negócio onde você se beneficiaria ao usar um algoritmo específico, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).
Os algoritmos de mineração de dados fornecidos no Analysis Services também são extensivamente personalizáveis. Você pode controlar o comportamento do algoritmo e como ele processa os dados definindo parâmetros de algoritmo. Os tópicos a seguir fornecem informações detalhadas sobre os parâmetros que cada algoritmo suporta.
Referência técnica do algoritmo Árvores de Decisão da Microsoft
Referência técnica do algoritmo Microsoft Clustering
Referência técnica do algoritmo Microsoft Naive Bayes
Referência técnica do algoritmo de associação da Microsoft
Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)
Referência técnica do algoritmo Rede Neural da Microsoft
Referência técnica do algoritmo Regressão Logística da Microsoft
Referência Técnica do Algoritmo de Regressão Linear da Microsoft
Referência técnica do algoritmo MTS
O tópico para cada tipo algoritmo também lista as funções de previsão que podem ser usadas com modelos com base em algoritmo.
Lista de parâmetros de algoritmo
Cada algoritmo aceita parâmetros que podem ser usados para personalizar o comportamento do algoritmo e ajustar os resultados do modelo. Para obter uma descrição de como usar cada parâmetro, consulte os tópicos a seguir:
Requisitos adicionais
Escolher e preparar dados é uma parte importante do processo de mineração de dados. Por exemplo, os algoritmos que a Microsoft fornece não permitem chaves duplicadas. O tipo de dados requerido para cada modelo difere de acordo com o algoritmo. Para obter mais informações, consulte a seção Requisitos dos seguintes tópicos:
Personalizando resultados usando consultas e funções de previsão
Depois que o modelo foi criado e processado, você pode exibir as informações usando um dos visualizadores específicos para cada modelo. Como alternativa, você pode criar consultas personalizadas usando DMX (Data Mining Extensions) para obter informações avançadas e mais detalhadas sobre os padrões de dados encontrados.
Para obter informações sobre como criar consultas que retornam o conteúdo do modelo, consulte Consultando modelos de mineração de dados (Analysis Services - Mineração de dados).
Você pode usar funções para ampliar os resultados retornados por um modelo de mineração. Algumas funções também retornam estatísticas que representam a probabilidade de um resultado ou outras pontuações. Além disso, os algoritmos individuais também podem dar suporte a funções adicionais. Por exemplo, se um modelo de mineração usa clustering, você pode usar funções especiais para localizar informações sobre clusters. Entretanto, se seu modelo tem como base o algoritmo de série temporal, há um conjunto diferente de funções disponíveis para fazer previsões e consultar o conteúdo do modelo. Para obter mais informações, consulte o tópico de referência técnica de cada algoritmo.
Para obter exemplos de como consultar um modelo de mineração e usar funções de previsão projetadas para tipos específicos de modelos, consulte Consultando modelos de mineração de dados (Analysis Services - Mineração de dados).
Para obter uma lista das funções de previsão aceitas por todos os tipos de algoritmos, consulte Mapeando funções para tipos de consulta (DMX).
Avaliando alterações em um modelo
Quando você faz experiências com modelos diferentes para resolver um problema comercial, ou cria variações de um modelo, precisa medir a precisão de cada modelo e avaliar como cada um deles responde ao problema comercial. Para obter informações gerais sobre avaliação de modelos de mineração de dados, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados]. Para obter mais informações sobre representar em gráficos a precisão de modelos de mineração diferentes, consulte Ferramentas para criar gráficos de precisão de modelos (Analysis Services - Mineração de dados).