Partilhar via


Gráfico de ganho (Analysis Services - Mineração de dados)

Um gráfico de ganho exibe o aumento estimado de ganho que está associado ao uso de um modelo de mineração. Por exemplo, se seu modelo previr quais clientes a empresa deveria contatar em um cenário de negócios, o gráfico de ganho incorporará informações sobre o custo de uma campanha de mala direta para contatar x clientes e calculará o ganho estimado. Um gráfico de ganho típico mostra um aumento nos lucros até certo ponto; depois disso, os lucros diminuem à medida que mais pessoas são contatadas.

Entendendo o gráfico de ganho

Um gráfico de lucro é semelhante a um gráfico de comparação de precisão. Como um gráfico de comparação de precisão, um gráfico de lucro pode ser usado para comparar vários modelos, contanto que todos eles prevejam o mesmo atributo discreto. Não há nenhuma interface separada para criar um gráfico de lucro; você inicia usando a guia Gráfico de comparação de precisão da guia Gráfico de Precisão de Mineração do Designer de Mineração de Dados e, em seguida, adiciona as informações de custo e lucro que são específicas para gráficos de lucro.

Para ilustrar como isto funciona, este tópico mostra um gráfico de lucro que foi criado para prever quais clientes potenciais mais provavelmente comprarão uma bicicleta, e quanto lucro você pode ter se focar esses clientes seletivamente.

Para acompanhar este cenário, use o modelo de árvore de decisão, TM_Decision Tree, que você criou no Tutorial Básico de Mineração de Dados. Você inicia selecionando um modelo e um atributo previsível, como faria para um gráfico de comparação de precisão, mas selecione Gráfico de Lucro na lista.

A caixa de diálogo Configurações do Gráfico de Ganho automaticamente abre sempre que você escolher o gráfico de lucro como o tipo de gráfico. Esta caixa de diálogo ajuda a especificar os custos e os benefícios associados a uma campanha de mala direta. Assim que você definir os parâmetros que configuram um gráfico de ganho, o gráfico exibido mudará automaticamente para um gráfico de ganho. Para o gráfico mostrado nestes exemplos, nós usamos os valores a seguir:

Configurações

Value

Escolha um modelo

TM_DecisionTree

Definir o atributo previsível e o valor previsível

para este cenário, você realmente só deseja os clientes que provavelmente comprarão uma bicicleta, assim escolha [Comprador de Bicicleta] = 1

Em outros cenários, pode ser mais importante modelar despesas negativas: ou seja, você deseja que seu gráfico de lucro responda pelo custo de fazer uma falsa previsão. Nesse cenário, você não especificaria nenhum valor previsível específico e mede todos os resultados.

Escolha o conjunto de dados de testes ou os dados usados para avaliar a exatidão e a rentabilidade do modelo

Se você quer avaliar apenas a precisão geral da lucratividade do modelo, pode usar um conjunto de testes que foi gerado ao criar a estrutura de mineração.

Porém, se você desejar prever a exatidão e a rentabilidade do modelo em dados reais, use o conjunto de dados que contém seus clientes potenciais e seus respectivos atributos.

Defina o valor para a população de destino total

Seu banco de dados pode conter muitos clientes, mas, para economizar em despesas de envio, você deve se dirigir somente aos 20.000 principais clientes que o modelo identifica como mais prováveis de responder.

Insira o custo único de criar uma campanha de mala direta para 20.000 pessoas

500

Insira o custo individual da campanha de mala direta.

Esse valor será multiplicado por 20.000 ou um número menor, dependendo de quantos clientes o modelo previr como bons clientes potenciais.

3

Insira um valor que representa a quantidade de lucro ou receita que pode ser esperada de um resultado com êxito.

Essa quantia será usada para projetar o lucro total associado aos casos de alta probabilidade.

25

Interpretando os resultados

O diagrama a seguir mostra o gráfico que foi baseado nestes parâmetros. O eixo Y do gráfico representa o ganho, enquanto que o eixo X representa a porcentagem da população que a empresa contatou.

exemplo de gráfico de ganho simples

O gráfico de ganho contém uma linha vertical cinza que marca uma porcentagem da população alvo. Você pode mover a linha clicando em um local no gráfico. Cada vez que a linha é movida, a Legenda de Mineração é atualizada para refletir o valor da porcentagem, a pontuação de ganho e a probabilidade prevista associada à porcentagem da população na linha vertical cinza. Se você mover a linha cinza para o ponto no gráfico onde os lucros são maiores, poderá usar o valor de probabilidade previsto para determinar uma estratégia para contatar os clientes.

Casos de porcentagem

Série, Modelo

Ganho

PredictProbability

30

  

$103,000

67.23%

40

TM_Decision Tree

$128,500

60.90%

50

  

$149,500

50.70%

60

  

$168,000

44.05%

Com este gráfico, você poderia determinar que o pico da curva de ganho está em 55% da população e a probabilidade prevista associada é de 20%. Esses resultados indicam que para conseguir ganho máximo, você deve contatar somente aqueles clientes cuja resposta prevê 20% de chance ou mais.

Conteúdo relacionado

Os tópicos a seguir contêm mais informações sobre como você pode criar e usar gráficos de precisão.

Tópicos

Links

Fornece um passo a passo sobre como criar um gráfico de comparação de precisão para o modelo Mala Direta Dirigida.

Tutorial de mineração de dados básico

Testando a precisão com gráficos de comparação de precisão (Tutorial de mineração de dados básico)

Explica os tipos de gráficos relacionados.

Gráfico de comparação de precisão (Analysis Services - Mineração de Dados)

Matriz de classificação (Analysis Services - Mineração de dados)

Dispersão (Analysis Services - Mineração de dados)

Descreve validação cruzada para modelos de mineração e estruturas de mineração.

Validação cruzada (Analysis Services - Mineração de dados)

Descreve as etapas para criar gráficos de comparação de precisão e outros gráficos de exatidão.

Tarefas de teste e validação e guias práticos (mineração de dados)

Consulte também

Conceitos

Teste e validação (mineração de dados)