Processando estruturas e modelos (Analysis Services – Mineração de Dados)
Um objeto de mineração de dados é apenas um contêiner vazio até que seja processado. O processamento de um modelo de mineração de dados também é chamado de treinamento.
Processando estruturas de mineração: uma estrutura de mineração obtém dados de uma fonte de dados externa, como definido pelas associações de coluna e pelos metadados de uso, e os lê. Esses dados são totalmente lidos e, depois, analisados para se extrair diversas estatísticas. O Analysis Services armazena uma representação compacta de dados, que é adequada para a análise de algoritmos de mineração de dados, em um cache local. Você pode tanto manter esse cache com excluí-lo depois do processamento de seus modelos. Por padrão, o cache é armazenado. Para obter mais informações, consulte Como processar uma estrutura de mineração.
Processando modelos de mineração: um modelo de mineração está vazio e contém apenas definições até que seja processado. Para processar um modelo de mineração, a estrutura de mineração na qual ele se baseia deve ter sido processada. O modelo de mineração obtém dados do cache da estrutura de mineração e aplica quaisquer filtros que tenham sido criados no modelo. Em seguida, ele submete o conjunto de dados ao algoritmo para detectar padrões. Depois que o modelo é processado, ele armazena apenas os resultados do processamento, e não os próprios dados. Para obter mais informações, consulte Como processar um modelo de mineração.
O diagrama a seguir mostra o fluxo de dados quando uma estrutura de mineração é processada e quando um modelo de mineração é processado.
Consultas no repositório relacional durante o processamento
O processamento tem três fases: consultar a fonte de dados, determinar estatísticas brutas e usar a definição e o algoritmo do modelo para treinar o modelo de mineração.
O servidor do Analysis Services emite consultas para o banco de dados que fornece os dados brutos. Esse banco de dados pode ser uma instância do SQL Server 2008 ou uma versão anterior do mecanismo de banco de dados do SQL Server. Quando você processa uma estrutura de mineração de dados, os dados da fonte são transferidos para a estrutura de mineração e mantidos no disco em um novo formato compactado. Nem todas as colunas da fonte de dados são processadas; apenas as colunas incluídas na estrutura de mineração, de acordo com as associações.
Usando esses dados, o Analysis Services cria um índice de todas as colunas diferenciadas e de dados e cria um índice à parte para as colunas contínuas. É emitida uma consulta para cada tabela aninhada a fim de criar o índice, e uma consulta adicional por tabela aninhada é gerada para processar relações entre cada par de tabela aninhada e de tabela de casos. O motivo para a criação de várias consultas é para processar um cubo OLAP interno especial. Você pode limitar o número de consultas que o Analysis Services envia para o repositório relacional definindo a propriedade de servidor DatabaseConnectionPoolMax. Para obter mais informações, consulte Propriedades OLAP.
Quando você processa um modelo, ele não relê os dados da fonte de dados. Em vez disso, ele obtém o resumo dos dados da estrutura de mineração. Com o uso do cubo criado, junto com o cache do índice e os dados de caso em cache, o servidor cria threads independentes para treinar os modelos.
No SQL Server Enterprise, todo o processamento ocorre em paralelo. No SQL Server Standard, o processamento é serializado.
Exibindo os resultados do processamento
Após o processamento de uma estrutura de mineração, ela conterá uma representação compacta dos dados para uso em análises estatísticas. Se o cache não foi limpo, você poderá acessar os dados dos seguintes modos:
Criando uma consulta DMX (Data Mining Extensions) no modelo e detalhando a estrutura. Para obter mais informações, consulte SELECIONAR A PARTIR DE CASOS DE <modelo> (DMX).
Procurando um modelo com base na estrutura e usando uma das opções da interface do usuário para detalhar os casos na estrutura. Para obter mais informações, consulte Exibindo um modelo de mineração de dados ou Como detalhar dados do caso a partir do modelo de mineração.
Criando uma consulta DMX nos casos da estrutura. Para obter mais informações, consulte SELECT FROM <estrutura>.CASES.
Após o processamento de um modelo de mineração, ele contém apenas os padrões derivados da análise e os mapeamento dos resultados do modelo com relação aos dados de treinamento armazenados em cache. Você pode pesquisar ou consultar os resultados do modelo, chamados de conteúdo do modelo, ou pode consultar os casos da estrutura e do modelo se tiverem sido armazenados em cache.
O conteúdo de cada modelo de mineração depende do algoritmo que foi usado para criá-lo. Por exemplo, se você tiver um modelo de cluster e um modelo de árvores de decisão, o conteúdo deles será muito diferente, mesmo que tenham usado exatamente os mesmos dados. Para obter mais informações, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).
Consulte também