Consultas de mineração de dados

Artigo
07/30/2013

Consultas de mineração de dados são úteis para muitos propósitos. Você pode:

Aplicar o modelo a novos dados, para fazer previsões únicas ou várias. Você pode fornecer valores de entrada como parâmetros, ou em um lote.
Obter um resumo estatístico dos dados usados para treinar.
Extrair padrões e regras ou gerar um perfil do caso típico que representa um padrão no modelo.
Extrair fórmulas de regressão e outros cálculos que explicam padrões.
Obter os casos que se ajustem a um padrão específico.
Recuperar detalhes sobre casos individuais usados no modelo, incluindo dados não usados na análise.
Treinar novamente um modelo adicionando novos dados ou executar previsão cruzada.

Esta seção fornece uma visão geral das informações necessárias para você começar a trabalhar com consultas de mineração de dados. Descreve os tipos de consultas que você pode criar em objetos de mineração de dados, introduz as ferramentas de consulta e linguagens de consulta, e fornece links para exemplos de consultas que você pode criar em modelos que foram criados usando os algoritmos fornecidos no SQL Server Data Mining.

Entendendo as consultas de mineração de dados

Ferramentas de consulta e interfaces

Consultas para tipos de modelo diferentes

Requisitos

Entendendo as consultas de mineração de dados

O Analysis Services Data Mining dá suporte aos seguintes tipos de consultas:

Consultas de previsão (Mineração de Dados)

Consultas que fazem inferências com base em padrões no modelo, e de dados de entrada.
Consultas de conteúdo (mineração de dados)

Consultas que retornam metadados, estatísticas e outras informações sobre o próprio modelo.
Consultas de detalhamento (mineração de dados)

Consultas que podem recuperar os dados de caso subjacentes para o modelo, ou até mesmo dados da estrutura que não foi usada no modelo.
Consultas de definição de dados (mineração de dados)

Consultas que não retornam informações do modelo, mas são usadas para compilar modelos e estruturas ou atualizar os dados em um modelo ou estrutura.

Antes de criar consultas, nós recomendamos que você se acostume com as diferenças entre modelos criados com cada algoritmo de mineração de dados fornecido pelo SQL Server.

Navegue e explore cada tipo de modelo usando os visualizadores de mineração de dados personalizados que são fornecidos para cada tipo de algoritmo. Para obter mais informações, consulte Tarefas e instruções do visualizador do modelo de mineração.
Analise o conteúdo do modelo para cada tipo de modelo, usando o Visualizador de Árvore de Conteúdo Genérica da Microsoft. Para interpretar estas informações, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

Ferramentas de consulta e interfaces

Você pode criar consultas de mineração de dados interativamente usando uma das ferramentas de consulta fornecidas pelo SQL Server. O Construtor de Consultas de Previsão gráfica é fornecido no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Se você não usou o Construtor de Consultas de Previsão antes, nós recomendamos que você siga as etapas no Tutorial de mineração de dados básico para se acostumar com a interface. Para obter uma visão geral rápida das etapas, consulte Criar uma consulta usando o Criar uma consulta de previsão usando o construtor de consultas de previsão.

O Construtor de Consultas de Previsão é útil para iniciar consultas que você personalizará posteriormente. Você pode adicionar fontes de dados facilmente e mapeá-los para colunas e, em seguida, alternar a exibição de DMX e personalizar a consulta adicionando uma cláusula WHERE ou outras funções.

Quando você estiver familiarizado com modelos de mineração de dados e como criar consultas, você também poderá escrever consultas diretamente usando extensões DMX. O DMX é uma linguagem de consulta semelhante ao Transact-SQL, e que você pode usar de muitos clientes diferentes. O DMX é a ferramenta ideal para criar previsões personalizadas e consultas complexas. Para obter uma introdução ao DMX, consulte Criando e consultando modelos de mineração de dados com DMX: Tutoriais (Analysis Services – Mineração de dados).

Os editores de DMX são fornecidos no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Você também pode usar o Construtor de Consultas de Previsão para iniciar suas consultas e, em seguida, alterar a exibição para o editor de texto e copiar a instrução DMX para outro cliente. Para obter mais informações, consulte Interfaces de Consulta de Mineração de Dados.

Você pode compor instruções DMX programaticamente e enviá-las de seu cliente para o servidor do Analysis Services usando AMO ou XMLA. Porém, o DMX é a linguagem que você deve usar para criar consultas em um modelo de mineração.

Você também pode consultar os metadados, estatísticas e conteúdo do modelo usando DMVs (Exibições de Gerenciamento Dinâmico) que são baseados nos conjuntos de linhas de esquema de mineração de dados. Estes DMVs facilitam a recuperação de informações sobre o modelo digitando instruções SELECT; no entanto, você não pode criar previsões. Para obter mais informações sobre DMVs com suporte pelo Analysis Services, consulte Usar DMVs (Exibições de Gerenciamento Dinâmico) para monitorar o Analysis Services.

Finalmente, você também pode criar consultas de mineração de dados para uso em pacotes de Integration Services, usando a Tarefa Consulta de Mineração de Dados, ou a Transformação Consulta de Mineração de Dados. A tarefa de fluxo de controle dá suporte a vários tipos de consultas de DMX, enquanto a transformação de fluxo de dados só dá suporte a consultas que trabalham com dados no fluxo de dados, ou seja, consultas que usam a sintaxe PREDICTION JOIN.

Consultas para tipos de modelo diferentes

O algoritmo que foi usado quando o modelo foi criado influencia muito o tipo de informações que você pode obter de uma consulta de mineração de dados. A razão para as diferenças é que cada algoritmo processa os dados de um modo diferente, e armazena tipos diferentes de padrões. Por exemplo, alguns algoritmos criam clusters; outros criam árvores. Portanto, você pode precisar usar previsão especializada e funções de consulta, dependendo do tipo de modelo com o qual você está trabalhando.

A lista a seguir fornece um resumo das funções que você pode usar nas consultas:

Funções de previsão gerais: a função Predict é polimórfica, ou seja, ela trabalha com todos os tipos de modelo. Esta função automaticamente detectará o tipo de modelo com o qual você está trabalhando e solicita parâmetros adicionais. Para obter mais informações, consulte Predict (DMX).

Cuidado
Nem todos os modelos são usados para fazer previsões. Por exemplo, você pode criar um modelo de clustering que não tem um atributo previsível. Porém, mesmo que um modelo não tenha um atributo previsível, você poderá criar consultas de previsão que retornam outros tipos de informações úteis do modelo.

Funções de previsão personalizadas: cada tipo de modelo fornece um conjunto de funções de previsão criado para trabalhar com os padrões criados por aquele algoritmo.

Por exemplo, a função Lag é fornecida para modelos de série temporal, para permitir que você exiba os dados históricos usados para o modelo. Para os modelos de clustering, funções como ClusterDistance são mais significativas.

Para obter mais informações sobre as funções que têm suporte para cada tipo de modelo, consulte os links a seguir:

Exemplos de consulta de um modelo de associação	Algoritmo Naïve Bayes da Microsoft
Exemplos de consulta de modelo de clustering	Exemplos de consulta de modelo de rede neural
Exemplos de consulta de modelo de árvores de decisão	Exemplos de consulta de um modelo de clustering de sequências
Exemplos de consulta de modelo de regressão linear	Exemplos de consulta de um modelo de série temporal
Exemplos de consulta de modelo de regressão logística

Você também pode chamar funções VBA ou criar suas próprias funções. Para obter mais informações, consulte Funções (DMX).

Estatísticas gerais: há várias funções que podem ser usadas com quase qualquer tipo de modelo, que retornam um conjunto padrão de estatísticas descritivas, como desvio padrão.

Por exemplo, a função PredictHistogram retorna uma tabela que lista todos os estados da coluna especificada.

Para obter mais informações, consulte Funções de previsão gerais (DMX).
Estatísticas personalizadas: funções adicionais de suporte são fornecidas para cada tipo de modelo, para gerar estatísticas que sejam pertinentes à tarefa analítica específica.

Por exemplo, quando você estiver trabalhando com um modelo de clustering, pode usar a função PredictCaseLikelihood para retornar a pontuação de probabilidade associada a um determinado caso e cluster. Porém, se você criou um modelo de regressão linear, é mais interessante recuperar o coeficiente e interceptar, o que você pode fazer usando uma consulta de conteúdo.
Funções de conteúdo de modelo: o conteúdo de todos os modelos é representado em um formato de tabela padronizado que permite recuperar as informações com uma simples consulta. Você cria consultas no conteúdo do modelo usando o DMX. Você também pode obter um tipo de conteúdo do modelo de mineração usando os conjuntos de linhas de esquema de mineração de dados.

No conteúdo do modelo, o significado de cada linha ou nó da tabela que é retornada difere dependendo do tipo de algoritmo que foi usado para criar o modelo, assim como do tipo de dados da coluna. Para obter mais informações, consulte Consultas de conteúdo (mineração de dados).

Requisitos

Antes de poder criar uma consulta em relação a um modelo, o modelo de mineração de dados deve ter sido processado. O processamento de objetos do Analysis Services exige permissões especiais. Para obter mais informações sobre como processar modelos de mineração, consulte Requisitos e considerações de processamento (mineração de dados).

Executar consultas em um modelo de mineração de dados exige níveis diferentes de permissões, dependendo do tipo de consulta que você executar. Por exemplo, o detalhamento para dados de estrutura ou caso normalmente exige permissões adicionais que podem ser definidas no objeto de estrutura de mineração ou objeto de modelo de mineração.

No entanto, se sua consulta usar dados externos e incluir instruções como OPENROWSET ou OPENQUERY, o banco de dados que você estiver consultando deverá habilitar estas instruções e você deverá ter permissão nos objetos de banco de dados subjacentes.

Para obter mais informações sobre os contextos de segurança exigidas para executar consultas de mineração de dados, consulte Visão geral de segurança (mineração de dados)

Nesta seção

Os tópicos nesta seção introduzem cada tipo de consulta de mineração de dados em mais detalhes e fornecem links para exemplos detalhados de como criar consultas em modelos de mineração de dados.

Consultas de previsão (Mineração de Dados)

Consultas de conteúdo (mineração de dados)

Consultas de detalhamento (mineração de dados)

Consultas de definição de dados (mineração de dados)

Interfaces de Consulta de Mineração de Dados

Tarefas relacionadas

Use estes links para aprender a criar e trabalhar com consultas de mineração de dados.

Tarefas	Links
Exiba tutoriais e passo a passo em consultas de mineração de dados	Lição 6: Criando e trabalhando com previsões (Tutorial de mineração de dados básico) Tutorial DMX de previsão de série temporal
Use ferramentas de consulta de mineração de dados no SQL Server Management Studio e no SSDT (SQL Server Data Tools)	Criar uma consulta DMX no SQL Server Management Studio Criar uma consulta de previsão usando o construtor de consultas de previsão Aplicar funções de previsão a um modelo Editar manualmente uma consulta de previsão
Trabalhe com dados externos usados em consultas de previsão	Escolher e mapear dados de entrada para uma consulta de previsão Escolher e mapear dados de entrada para uma consulta de previsão
Trabalhe com os resultados de consultas	Exibir e salvar os resultados de uma consulta de previsão
Use DMX e modelos de consulta de XMLA fornecidos no Management Studio	Criar uma consulta de previsão singleton a partir de um modelo Criar uma consulta de mineração de dados usando XML/A Usar modelos do Analysis Services no SQL Server Management Studio
Saiba mais sobre consultas de conteúdo e veja exemplos	Criar uma consulta de conteúdo em um modelo de mineração Consultar os parâmetros usados para criar um modelo de mineração Consultas de conteúdo (mineração de dados)
Defina opções de consulta e solucione permissões de consulta e problemas	Alterar o valor do tempo limite de consultas de mineração de dados
Use os componentes de mineração de dados no Integration Services	Tarefa Consulta de Mineração de Dados Transformação Consulta de Mineração de Dados

Consulte também

Conceitos

Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)

Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)

Partilhar via

Consultas de mineração de dados

Entendendo as consultas de mineração de dados

Ferramentas de consulta e interfaces

Consultas para tipos de modelo diferentes

Requisitos

Nesta seção

Tarefas relacionadas

Consulte também

Conceitos

Recursos adicionais