Consultas de mineração de dados
Consultas de mineração de dados são úteis para muitos propósitos. Você pode:
Aplicar o modelo a novos dados, para fazer previsões únicas ou várias. Você pode fornecer valores de entrada como parâmetros, ou em um lote.
Obter um resumo estatístico dos dados usados para treinar.
Extrair padrões e regras ou gerar um perfil do caso típico que representa um padrão no modelo.
Extrair fórmulas de regressão e outros cálculos que explicam padrões.
Obter os casos que se ajustem a um padrão específico.
Recuperar detalhes sobre casos individuais usados no modelo, incluindo dados não usados na análise.
Treinar novamente um modelo adicionando novos dados ou executar previsão cruzada.
Esta seção fornece uma visão geral das informações necessárias para você começar a trabalhar com consultas de mineração de dados. Descreve os tipos de consultas que você pode criar em objetos de mineração de dados, introduz as ferramentas de consulta e linguagens de consulta, e fornece links para exemplos de consultas que você pode criar em modelos que foram criados usando os algoritmos fornecidos no SQL Server Data Mining.
Entendendo as consultas de mineração de dados
Ferramentas de consulta e interfaces
Consultas para tipos de modelo diferentes
Requisitos
Entendendo as consultas de mineração de dados
O Analysis Services Data Mining dá suporte aos seguintes tipos de consultas:
Consultas de previsão (Mineração de Dados)
Consultas que fazem inferências com base em padrões no modelo, e de dados de entrada.
Consultas de conteúdo (mineração de dados)
Consultas que retornam metadados, estatísticas e outras informações sobre o próprio modelo.
Consultas de detalhamento (mineração de dados)
Consultas que podem recuperar os dados de caso subjacentes para o modelo, ou até mesmo dados da estrutura que não foi usada no modelo.
Consultas de definição de dados (mineração de dados)
Consultas que não retornam informações do modelo, mas são usadas para compilar modelos e estruturas ou atualizar os dados em um modelo ou estrutura.
Antes de criar consultas, nós recomendamos que você se acostume com as diferenças entre modelos criados com cada algoritmo de mineração de dados fornecido pelo SQL Server.
Navegue e explore cada tipo de modelo usando os visualizadores de mineração de dados personalizados que são fornecidos para cada tipo de algoritmo. Para obter mais informações, consulte Tarefas e instruções do visualizador do modelo de mineração.
Analise o conteúdo do modelo para cada tipo de modelo, usando o Visualizador de Árvore de Conteúdo Genérica da Microsoft. Para interpretar estas informações, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
Ferramentas de consulta e interfaces
Você pode criar consultas de mineração de dados interativamente usando uma das ferramentas de consulta fornecidas pelo SQL Server. O Construtor de Consultas de Previsão gráfica é fornecido no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Se você não usou o Construtor de Consultas de Previsão antes, nós recomendamos que você siga as etapas no Tutorial de mineração de dados básico para se acostumar com a interface. Para obter uma visão geral rápida das etapas, consulte Criar uma consulta usando o Criar uma consulta de previsão usando o construtor de consultas de previsão.
O Construtor de Consultas de Previsão é útil para iniciar consultas que você personalizará posteriormente. Você pode adicionar fontes de dados facilmente e mapeá-los para colunas e, em seguida, alternar a exibição de DMX e personalizar a consulta adicionando uma cláusula WHERE ou outras funções.
Quando você estiver familiarizado com modelos de mineração de dados e como criar consultas, você também poderá escrever consultas diretamente usando extensões DMX. O DMX é uma linguagem de consulta semelhante ao Transact-SQL, e que você pode usar de muitos clientes diferentes. O DMX é a ferramenta ideal para criar previsões personalizadas e consultas complexas. Para obter uma introdução ao DMX, consulte Criando e consultando modelos de mineração de dados com DMX: Tutoriais (Analysis Services – Mineração de dados).
Os editores de DMX são fornecidos no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Você também pode usar o Construtor de Consultas de Previsão para iniciar suas consultas e, em seguida, alterar a exibição para o editor de texto e copiar a instrução DMX para outro cliente. Para obter mais informações, consulte Interfaces de Consulta de Mineração de Dados.
Você pode compor instruções DMX programaticamente e enviá-las de seu cliente para o servidor do Analysis Services usando AMO ou XMLA. Porém, o DMX é a linguagem que você deve usar para criar consultas em um modelo de mineração.
Você também pode consultar os metadados, estatísticas e conteúdo do modelo usando DMVs (Exibições de Gerenciamento Dinâmico) que são baseados nos conjuntos de linhas de esquema de mineração de dados. Estes DMVs facilitam a recuperação de informações sobre o modelo digitando instruções SELECT; no entanto, você não pode criar previsões. Para obter mais informações sobre DMVs com suporte pelo Analysis Services, consulte Usar DMVs (Exibições de Gerenciamento Dinâmico) para monitorar o Analysis Services.
Finalmente, você também pode criar consultas de mineração de dados para uso em pacotes de Integration Services, usando a Tarefa Consulta de Mineração de Dados, ou a Transformação Consulta de Mineração de Dados. A tarefa de fluxo de controle dá suporte a vários tipos de consultas de DMX, enquanto a transformação de fluxo de dados só dá suporte a consultas que trabalham com dados no fluxo de dados, ou seja, consultas que usam a sintaxe PREDICTION JOIN.
Consultas para tipos de modelo diferentes
O algoritmo que foi usado quando o modelo foi criado influencia muito o tipo de informações que você pode obter de uma consulta de mineração de dados. A razão para as diferenças é que cada algoritmo processa os dados de um modo diferente, e armazena tipos diferentes de padrões. Por exemplo, alguns algoritmos criam clusters; outros criam árvores. Portanto, você pode precisar usar previsão especializada e funções de consulta, dependendo do tipo de modelo com o qual você está trabalhando.
A lista a seguir fornece um resumo das funções que você pode usar nas consultas:
Funções de previsão gerais: a função Predict é polimórfica, ou seja, ela trabalha com todos os tipos de modelo. Esta função automaticamente detectará o tipo de modelo com o qual você está trabalhando e solicita parâmetros adicionais. Para obter mais informações, consulte Predict (DMX).
Cuidado Nem todos os modelos são usados para fazer previsões. Por exemplo, você pode criar um modelo de clustering que não tem um atributo previsível. Porém, mesmo que um modelo não tenha um atributo previsível, você poderá criar consultas de previsão que retornam outros tipos de informações úteis do modelo.
Funções de previsão personalizadas: cada tipo de modelo fornece um conjunto de funções de previsão criado para trabalhar com os padrões criados por aquele algoritmo.
Por exemplo, a função Lag é fornecida para modelos de série temporal, para permitir que você exiba os dados históricos usados para o modelo. Para os modelos de clustering, funções como ClusterDistance são mais significativas.
Para obter mais informações sobre as funções que têm suporte para cada tipo de modelo, consulte os links a seguir:
Exemplos de consulta de um modelo de clustering de sequências
Você também pode chamar funções VBA ou criar suas próprias funções. Para obter mais informações, consulte Funções (DMX).
Estatísticas gerais: há várias funções que podem ser usadas com quase qualquer tipo de modelo, que retornam um conjunto padrão de estatísticas descritivas, como desvio padrão.
Por exemplo, a função PredictHistogram retorna uma tabela que lista todos os estados da coluna especificada.
Para obter mais informações, consulte Funções de previsão gerais (DMX).
Estatísticas personalizadas: funções adicionais de suporte são fornecidas para cada tipo de modelo, para gerar estatísticas que sejam pertinentes à tarefa analítica específica.
Por exemplo, quando você estiver trabalhando com um modelo de clustering, pode usar a função PredictCaseLikelihood para retornar a pontuação de probabilidade associada a um determinado caso e cluster. Porém, se você criou um modelo de regressão linear, é mais interessante recuperar o coeficiente e interceptar, o que você pode fazer usando uma consulta de conteúdo.
Funções de conteúdo de modelo: o conteúdo de todos os modelos é representado em um formato de tabela padronizado que permite recuperar as informações com uma simples consulta. Você cria consultas no conteúdo do modelo usando o DMX. Você também pode obter um tipo de conteúdo do modelo de mineração usando os conjuntos de linhas de esquema de mineração de dados.
No conteúdo do modelo, o significado de cada linha ou nó da tabela que é retornada difere dependendo do tipo de algoritmo que foi usado para criar o modelo, assim como do tipo de dados da coluna. Para obter mais informações, consulte Consultas de conteúdo (mineração de dados).
Requisitos
Antes de poder criar uma consulta em relação a um modelo, o modelo de mineração de dados deve ter sido processado. O processamento de objetos do Analysis Services exige permissões especiais. Para obter mais informações sobre como processar modelos de mineração, consulte Requisitos e considerações de processamento (mineração de dados).
Executar consultas em um modelo de mineração de dados exige níveis diferentes de permissões, dependendo do tipo de consulta que você executar. Por exemplo, o detalhamento para dados de estrutura ou caso normalmente exige permissões adicionais que podem ser definidas no objeto de estrutura de mineração ou objeto de modelo de mineração.
No entanto, se sua consulta usar dados externos e incluir instruções como OPENROWSET ou OPENQUERY, o banco de dados que você estiver consultando deverá habilitar estas instruções e você deverá ter permissão nos objetos de banco de dados subjacentes.
Para obter mais informações sobre os contextos de segurança exigidas para executar consultas de mineração de dados, consulte Visão geral de segurança (mineração de dados)
Nesta seção
Os tópicos nesta seção introduzem cada tipo de consulta de mineração de dados em mais detalhes e fornecem links para exemplos detalhados de como criar consultas em modelos de mineração de dados.
Consultas de previsão (Mineração de Dados)
Consultas de conteúdo (mineração de dados)
Consultas de detalhamento (mineração de dados)
Consultas de definição de dados (mineração de dados)
Interfaces de Consulta de Mineração de Dados
Tarefas relacionadas
Use estes links para aprender a criar e trabalhar com consultas de mineração de dados.
Consulte também
Conceitos
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)