Strutture di data mining (Analysis Services)
In Microsoft SQL Server 2005 Analysis Services (SSAS) esistono vari oggetti coinvolti nel data mining. I due oggetti principali utilizzati sono i seguenti:
- Struttura di data mining
- Modello di data mining
Gli altri oggetti coinvolti nel processo sono le colonne di strutture e modelli di data mining. Per ulteriori informazioni su questi oggetti, vedere Colonne della struttura di data mining e Colonne del modello di data mining.
Struttura di data mining
Per struttura di data mining si intende una struttura di dati che definisce il dominio da cui vengono generati i modelli di data mining. Una singola struttura di data mining può contenere più modelli di data mining che condividono lo stesso dominio.
Gli elementi fondamentali della struttura di data mining sono le relative colonne, che descrivono le informazioni contenute nell'origine dei dati. Tali colonne includono informazioni quali il tipo di dati, il tipo di contenuto e la modalità di distribuzione dei dati.
Una struttura di data mining può contenere anche tabelle nidificate. Una tabella nidificata rappresenta una relazione uno-a-molti tra l'entità di un case e gli attributi correlati. Se ad esempio le informazioni che descrivono il cliente sono contenute in una tabella mentre quelle relative agli acquisti del cliente sono contenute in un'altra tabella, è possibile utilizzare le tabelle nidificate per combinare le informazioni in un singolo case. L'identificatore del cliente è l'entità, mentre gli acquisti sono gli attributi correlati. Per ulteriori informazioni sull'utilizzo delle tabelle nidificate, vedere Tabelle nidificate.
La struttura di data mining non contiene informazioni sulla modalità di utilizzo delle colonne per un modello di data mining specifico o sul tipo di algoritmo utilizzato per generare un modello. Tali informazioni vengono definite nel modello stesso.
Modello di data mining
Un modello di data mining applica un algoritmo specifico ai dati rappresentati da una struttura di data mining. Analogamente alla struttura, il modello di data mining contiene colonne. Un modello di data mining è contenuto all'interno della struttura di data mining ed eredita tutti i valori delle proprietà definite dalla struttura. Il modello può utilizzare tutte le colonne contenute nella struttura di data mining o un subset delle colonne.
Oltre ai parametri definiti nella struttura di data mining, il modello di data mining include due proprietà: Algorithm e Usage. Il parametro algorithm viene definito nel modello di data mining, mentre il parametro usage viene definito nella colonna del modello. Tali parametri sono descritti nella tabella seguente.
- algorithm
Proprietà del modello che definisce l'algoritmo utilizzato per creare il modello.
- usage
Proprietà di una colonna del modello che definisce la modalità di utilizzo della colonna nel modello. È possibile definire colonne di input, colonne chiave o colonne stimabili.
Un modello di data mining è soltanto un oggetto vuoto fino a quando non viene elaborato. Quando si elabora un modello, i dati definiti dalla struttura vengono passati attraverso l'algoritmo. Quest'ultimo identifica regole e schemi all'interno dei dati e quindi utilizza tali elementi per popolare il modello. Per ulteriori informazioni sull'utilizzo degli algoritmi per la creazione dei modelli di data mining, vedere Algoritmi di data mining.
Dopo aver elaborato un modello, è possibile esplorarlo tramite i visualizzatori personalizzati disponibili in Business Intelligence Development Studio e in SQL Server Management Studio o mediante relative query per l'esecuzione di stime. Per ulteriori informazioni sui visualizzatori personalizzati disponibili in Analysis Services, vedere Visualizzazione di un modello di data mining.
È possibile creare più modelli basati sulla stessa struttura. Tutti i modelli generati dalla stessa struttura devono derivare dalla stessa origine dei dati. Tuttavia, i modelli possono differenziarsi in base alle colonne della struttura utilizzate, al tipo di utilizzo delle colonne, al tipo di algoritmo utilizzato per la creazione di ogni modello e alle impostazioni dei parametri per ogni algoritmo. Ad esempio, è possibile generare modelli di struttura decisionale e di clustering separati, ognuno contenente colonne della struttura diverse e utilizzato per eseguire attività aziendali diverse.
Vedere anche
Attività
Procedura: Aggiunta di un modello di data mining a una struttura di data mining esistente
Procedura: Creazione di una nuova struttura di data mining relazionale
Procedura: Elaborazione di un modello di data mining
Concetti
Oggetti di Analysis Services
Concetti di base sul data mining
Colonne del modello di data mining
Altre risorse
Building Data Mining Models
Colonne della struttura di data mining