Partilhar via


Personalizando um modelo de mineração de dados (Analysis Services – Mineração de dados)

Depois de selecionar um algoritmo que atende as necessidades do seu negócio, é possível personalizar o modelo de mineração das formas a seguir para melhorar potencialmente os resultados.

  • Use colunas diferentes de dados no modelo ou altere os uso ou tipos de conteúdo das colunas.

  • Crie filtros no modelo de mineração para restringir os dados usados para treinar o modelo.

  • Defina parâmetros de algoritmo para controlar limites, divisões de árvore e outras condições.

  • Altere o algoritmo padrão que é usado para analisar dados ou fazer previsões.

Alterando os dados usados pelo modelo

As decisões relacionadas a quais colunas de dados serão usadas no modelo e como usar e processar os dados podem afetar consideravelmente os resultados da análise. Os tópicos a seguir fornecem informações para ajudá-lo a entender essas escolhas.

Se você usar o Assistente para Mineração de Dados, o Analysis Services poderá selecionar, automaticamente, os dados mais úteis para criar um determinado modelo.

Personalizando as configurações do algoritmo

A escolha do algoritmo determina que tipo de resultados você terá. Para obter informações gerais sobre como um algoritmo específico funciona ou sobre os cenários de negócio onde você se beneficiaria ao usar um algoritmo específico, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).

Os algoritmos de mineração de dados fornecidos no Analysis Services também são extensivamente personalizáveis. Você pode controlar o comportamento do algoritmo e como ele processa os dados definindo parâmetros de algoritmo. Os tópicos a seguir fornecem informações detalhadas sobre os parâmetros que cada algoritmo suporta.

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo Microsoft Naive Bayes

Referência técnica do algoritmo de associação da Microsoft

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

Referência técnica do algoritmo Rede Neural da Microsoft

Referência técnica do algoritmo Regressão Logística da Microsoft

Referência Técnica do Algoritmo de Regressão Linear da Microsoft

Referência técnica do algoritmo MTS

O tópico para cada tipo algoritmo também lista as funções de previsão que podem ser usadas com modelos com base em algoritmo.

Lista de parâmetros de algoritmo

Cada algoritmo aceita parâmetros que podem ser usados para personalizar o comportamento do algoritmo e ajustar os resultados do modelo. Para obter uma descrição de como usar cada parâmetro, consulte os tópicos a seguir:

Nome da propriedade

Aplica-se a

AUTO_DETECT_PERIODICITY

Referência técnica do algoritmo MTS

CLUSTER_COUNT

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

CLUSTER_SEED

Referência técnica do algoritmo Microsoft Clustering

CLUSTERING_METHOD

Referência técnica do algoritmo Microsoft Clustering

COMPLEXITY_PENALTY

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo MTS

FORCE_REGRESSOR

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência Técnica do Algoritmo de Regressão Linear da Microsoft

Sinalizadores de modelagem (Mineração de Dados)

FORECAST_METHOD

Referência técnica do algoritmo MTS

HIDDEN_NODE_RATIO

Referência técnica do algoritmo Rede Neural da Microsoft

HISTORIC_MODEL_COUNT

Referência técnica do algoritmo MTS

HISTORICAL_MODEL_GAP

Referência técnica do algoritmo MTS

HOLDOUT_PERCENTAGE

Referência técnica do algoritmo Regressão Logística da Microsoft

Referência técnica do algoritmo Rede Neural da Microsoft

ObservaçãoObservação
Este parâmetro é diferente do valor da porcentagem de controle que se aplica a uma estrutura de mineração.

HOLDOUT_SEED

Referência técnica do algoritmo Regressão Logística da Microsoft

Referência técnica do algoritmo Rede Neural da Microsoft

ObservaçãoObservação
Este parâmetro é diferente do valor da semente de controle que se aplica a uma estrutura de mineração.

INSTABILITY_SENSITIVITY

Referência técnica do algoritmo MTS

MAXIMUM_INPUT_ATTRIBUTES

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência Técnica do Algoritmo de Regressão Linear da Microsoft

Referência técnica do algoritmo Microsoft Naive Bayes

Referência técnica do algoritmo Rede Neural da Microsoft

Referência técnica do algoritmo Regressão Logística da Microsoft

MAXIMUM_ITEMSET_COUNT

Referência técnica do algoritmo de associação da Microsoft

MAXIMUM_ITEMSET_SIZE

Referência técnica do algoritmo de associação da Microsoft

MAXIMUM_OUTPUT_ATTRIBUTES

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência Técnica do Algoritmo de Regressão Linear da Microsoft

Referência técnica do algoritmo Regressão Logística da Microsoft

Referência técnica do algoritmo Microsoft Naive Bayes

Referência técnica do algoritmo Rede Neural da Microsoft

MAXIMUM_SEQUENCE_STATES

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

MAXIMUM_SERIES_VALUE

Referência técnica do algoritmo MTS

MAXIMUM_STATES

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo Rede Neural da Microsoft

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

MAXIMUM_SUPPORT

Referência técnica do algoritmo de associação da Microsoft

MINIMUM_IMPORTANCE

Referência técnica do algoritmo de associação da Microsoft

MINIMUM_ITEMSET_SIZE

Referência técnica do algoritmo de associação da Microsoft

MINIMUM_DEPENDENCY_PROBABILITY

Referência técnica do algoritmo Microsoft Naive Bayes

MINIMUM_PROBABILITY

Referência técnica do algoritmo de associação da Microsoft

MINIMUM_SERIES_VALUE

Referência técnica do algoritmo MTS

MINIMUM_SUPPORT

Referência técnica do algoritmo de associação da Microsoft

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo MSC (Analysis Services - Mineração de Dados)

Referência técnica do algoritmo MTS

MISSING_VALUE_SUBSTITUTION

Referência técnica do algoritmo MTS

MODELLING_CARDINALITY

Referência técnica do algoritmo Microsoft Clustering

PERIODICITY_HINT

Referência técnica do algoritmo MTS

PREDICTION_SMOOTHING

Referência técnica do algoritmo MTS

SAMPLE_SIZE

Referência técnica do algoritmo Microsoft Clustering

Referência técnica do algoritmo Regressão Logística da Microsoft

Referência técnica do algoritmo Rede Neural da Microsoft

SCORE_METHOD

Referência técnica do algoritmo Árvores de Decisão da Microsoft

SPLIT_METHOD

Referência técnica do algoritmo Árvores de Decisão da Microsoft

STOPPING_TOLERANCE

Referência técnica do algoritmo Microsoft Clustering

Requisitos adicionais

Escolher e preparar dados é uma parte importante do processo de mineração de dados. Por exemplo, os algoritmos que a Microsoft fornece não permitem chaves duplicadas. O tipo de dados requerido para cada modelo difere de acordo com o algoritmo. Para obter mais informações, consulte a seção Requisitos dos seguintes tópicos:

Personalizando resultados usando consultas e funções de previsão

Depois que o modelo foi criado e processado, você pode exibir as informações usando um dos visualizadores específicos para cada modelo. Como alternativa, você pode criar consultas personalizadas usando DMX (Data Mining Extensions) para obter informações avançadas e mais detalhadas sobre os padrões de dados encontrados.

Para obter informações sobre como criar consultas que retornam o conteúdo do modelo, consulte Consultando modelos de mineração de dados (Analysis Services - Mineração de dados).

Você pode usar funções para ampliar os resultados retornados por um modelo de mineração. Algumas funções também retornam estatísticas que representam a probabilidade de um resultado ou outras pontuações. Além disso, os algoritmos individuais também podem dar suporte a funções adicionais. Por exemplo, se um modelo de mineração usa clustering, você pode usar funções especiais para localizar informações sobre clusters. Entretanto, se seu modelo tem como base o algoritmo de série temporal, há um conjunto diferente de funções disponíveis para fazer previsões e consultar o conteúdo do modelo. Para obter mais informações, consulte o tópico de referência técnica de cada algoritmo.

Para obter exemplos de como consultar um modelo de mineração e usar funções de previsão projetadas para tipos específicos de modelos, consulte Consultando modelos de mineração de dados (Analysis Services - Mineração de dados).

Para obter uma lista das funções de previsão aceitas por todos os tipos de algoritmos, consulte Mapeando funções para tipos de consulta (DMX).

Avaliando alterações em um modelo

Quando você faz experiências com modelos diferentes para resolver um problema comercial, ou cria variações de um modelo, precisa medir a precisão de cada modelo e avaliar como cada um deles responde ao problema comercial. Para obter informações gerais sobre avaliação de modelos de mineração de dados, consulte Validando modelos de mineração de dados [Analysis Services - Mineração de Dados]. Para obter mais informações sobre representar em gráficos a precisão de modelos de mineração diferentes, consulte Ferramentas para criar gráficos de precisão de modelos (Analysis Services - Mineração de dados).