Criar uma nova estrutura de mineração OLAP
Você pode usar o Assistente de Mineração de Dados na Microsoft SQL Server Analysis Services para criar uma estrutura de mineração que usa dados de um modelo multidimensional. Modelos de mineração baseados em cubos OLAP podem usar a coluna e os valores de tabelas de fatos, dimensões e grupos de medidas como atributos para análise.
Para criar uma nova estrutura de mineração OLAP
Em Gerenciador de Soluções no SSDT (SQL Server Data Tools), clique com o botão direito do mouse na pasta Estruturas de Mineração em um projeto do Analysis Services e clique em Nova Estrutura de Mineração para abrir o Assistente de Mineração de Dados.
Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.
Na página Selecionar o Método de Definição , selecione De cubo existentee clique em Avançar.
Se você receber um erro com a mensagem Não é possível recuperar uma lista de algoritmos de mineração de dados aceitos, abra a caixa de diálogo Propriedades do Projeto e verifique se especificou o nome de uma instância do Analysis Services que dá suporte a modelos multidimensionais. Não é possível criar modelos de mineração em uma instância do Analysis Services que dê suporte à modelagem tabular.
Na página Criar a Estrutura de Mineração de Dados , decida se você criará somente uma estrutura de mineração ou uma estrutura de mineração, além de um modelo de mineração relacionado. Em geral, é mais fácil criar um modelo de mineração ao mesmo tempo para que você seja solicitado a incluir as colunas necessárias.
Se você criar um modelo de mineração, selecione o algoritmo de mineração de dados que você quer usar e clique em Avançar. Para obter mais informações sobre como escolher um algoritmo, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).
Na página Selecionar a Dimensão do Cubo de Origem , em Selecionar uma Dimensão do Cubo de Origem, localize a dimensão que contém a maioria de seus dados de caso.
Por exemplo, se estiver tentando identificar agrupamentos de clientes, poderá escolher a dimensão Cliente; se estiver tentando analisar compras em transações, poderá escolher a dimensão Detalhes do Pedido de Vendas pela Internet. Você não está restrito a usar somente os dados desta dimensão, mas ela deve conter atributos importantes a serem usados na análise.
Clique em Próximo.
Na página Selecionar a Chave do Caso , em Atributos, selecione o atributo que será a chave da estrutura de mineração e clique em Avançar.
O atributo que você costuma usar como chave na estrutura de mineração também é uma chave da dimensão e será pré-selecionado.
Na página Selecionar Colunas de Nível de Caso , em Atributos e Medidas Relacionados, selecione os atributos e as medidas que contêm valores a serem adicionados à estrutura de mineração como dados de caso. Clique em Próximo.
Na página Especificar Uso de Colunas do Modelo de Mineração , em Estrutura do modelo de mineração, primeiro defina a coluna previsível e depois escolha colunas para usar como entradas.
Marque a caixa de seleção na coluna à extrema esquerda para incluir os dados na estrutura de mineração. Você pode incluir colunas na estrutura que usará para referência, mas não usá-las para análise.
Marque a caixa de seleção na coluna Entrada para usar o atributo como uma variável na análise.
Marque a caixa de seleção na coluna Prever somente para atributos previsíveis.
Note que as colunas designadas como chaves não podem ser usadas para entrada nem previsão.
Clique em Próximo.
Na página Especificar Uso de Colunas do Modelo de Mineração , você também pode adicionar e remover tabelas aninhadas da estrutura de mineração, usando Adicionar Tabelas Aninhadas e Tabelas Aninhadas.
Em um modelo de mineração de OLAP, uma tabela aninhada é outro conjunto de dados dentro do cubo que tem uma relação um-para-muitos com a dimensão que representa os atributos de caso. Portanto, quando a caixa de diálogo for aberta, ela selecionará previamente grupos de medidas que já estão relacionados à dimensão selecionada como a tabela de casos. Neste ponto, você escolheria uma dimensão diferente que contém informações adicionais úteis para análise.
Por exemplo, se estiver analisando clientes, você usará a dimensão [Cliente] como a tabela de casos. Para a tabela aninhada, você pode adicionar o motivo citado pelos clientes ao fazer uma compra, que está incluído na dimensão [Motivo de Vendas].
Se você adicionar dados aninhados, especifique duas colunas adicionais:
A chave da tabela aninhada: ela deve ser pré-selecionada na página Selecionar Chave de Tabela Aninhada.
Os atributos usados para análise: a página Selecionar Colunas de Tabela Aninhadafornece uma lista de medidas e atributos na seleção da tabela aninhada.
Para cada atributo incluído no modelo, marque a caixa na coluna esquerda.
Se quiser usar apenas o atributo para análise, marque a opção Entrada.
Se quiser incluir a coluna como um dos atributos previsíveis do modelo, selecione Prever.
Qualquer item incluído na estrutura, mas não especificado como uma entrada ou atributo previsível, é adicionado à estrutura com o sinalizador
Ignore
; isso significa que os dados são processados quando você cria o modelo, mas não são usado na análise, e estão disponíveis apenas para detalhamento. Isso pode ser útil se você quiser incluir detalhes como nomes de clientes, mas não quiser usá-los na análise.
Clique em Concluir para fechar a parte do assistente que trabalha com tabelas aninhadas. Você pode repetir o processo para adicionar varias colunas aninhadas.
Na página Especificar Conteúdo e Tipos de Dados das Colunas , em Estrutura de modelo de mineração, defina o tipo de conteúdo e o tipo de dados para cada coluna.
Observação
Os modelos de mineração OLAP não permitem o uso do recurso Detectar para detectar automaticamente se uma coluna contém dados contínuos ou distintos.
Clique em Próximo.
Na página Dividir Cubo de Origem , é possível filtrar os dados usados para criar a estrutura de mineração.
A divisão do cubo lhe permite restringir os dados que são usados para criar o modelo. Por exemplo, você pode criar modelos separados para cada região dividindo a hierarquia Geografia e
Dimensão: escolha uma dimensão relacionada na lista suspensa.
Hierarquia: selecione o nível da hierarquia de dimensões no qual você deseja aplicar o filtro. Por exemplo, se estiver dividindo pela dimensão [Geografia], você escolherá um nível de hierarquia como [Nome do País da Região].
Operador: escolha um operador na lista.
Expressão de Filtro: digite um valor ou uma expressão para servir como a condição de filtro ou use a lista suspensa para selecionar um valor da lista de membros no nível especificado da hierarquia.
Por exemplo, se você selecionou [Geography] como a dimensão e [Nome do País da Região] como o nível de hierarquia, a lista suspensa contém todos os países/regiões válidos que você pode usar como uma condição de filtro. Você pode fazer várias seleções. Como resultado, os dados na estrutura de mineração serão limitados a dados de cubo destas áreas geográficas.
Parameters: ignore esta caixa de seleção. Esta caixa de diálogo oferece suporte a vários cenários de filtragem de cubo e esta opção não é relevante para criar uma estrutura de mineração.
Clique em Próximo.
Na página Dividir os dados em conjuntos de treinamento e teste , especifique um percentual dos dados da estrutura de mineração a ser reservado para teste ou especifique o número máximo de casos de teste. Clique em Próximo.
Se você especificar ambos os valores, os limites serão combinados para usar o que for o mais baixo.
Na página Concluindo o Assistente , forneça um nome para a nova estrutura de mineração OLAP e para o modelo de mineração inicial.
Clique em Concluir.
Na página Concluindo o Assistente , você também tem a opção de criar uma dimensão do modelo de mineração e/ou um cubo usando a dimensão do modelo de mineração. Estas opções têm suporte apenas para modelos criados usando os seguintes algoritmos:
Algoritmo Microsoft Clustering
Algoritmo Árvores de Decisão da Microsoft
Algoritmo de Regras de Associação da Microsoft
Criar dimensão do modelo de mineração: marque esta caixa de seleção e forneça um nome de tipo para a dimensão do modelo de mineração. Quando você usar esta opção, uma nova dimensão será criada no cubo original que foi usado para criar a estrutura de mineração. Você pode usar esta dimensão para detalhar e conduzir análises adicionais. Como a dimensão está localizada no cubo, a dimensão é mapeada automaticamente para a dimensão de dados de caso.
Criar cubo usando a dimensão do modelo de mineração: marque esta caixa de seleção e forneça um nome para o novo cubo. Quando você usa esta opção, um novo cubo é criado, contendo as dimensões existentes, que foram usadas para criar a estrutura, e a nova dimensão de mineração de dados, contendo os resultados do modelo.