Colonne della struttura di data mining
In una struttura di data mining si definiscono le colonne al momento della creazione della struttura, scegliendo colonne di dati esterni e specificando quindi la modalità di utilizzo dei dati per la modellazione. Pertanto, le colonne della struttura di data mining non sono semplici copie dei dati di un'origine dati, ma definiscono la modalità in cui i dati dell'origine devono essere utilizzati dal modello di data mining. È possibile assegnare proprietà che determinano come vengono discretizzati i dati, proprietà che descrivono come sono distribuiti i valori dei dati
Le colonne della struttura di data mining sono state progettate in modo da risultare flessibili ed estensibili, in quanto ogni algoritmo utilizzato per compilare un modello di data mining può utilizzare colonne diverse della struttura allo scopo di interpretare i dati. Anziché disporre di un set di dati per ogni modello, è possibile utilizzare una sola struttura di data mining e le colonne che contiene per personalizzare i dati per ciascun modello.
Definizione di colonne della struttura di data mining
I tipi di dati di base e di contenuto che definiscono le colonne della struttura derivano dall'origine dati utilizzata per creare la struttura. È possibile modificare queste impostazioni all'interno della struttura di data mining, nonché impostare i flag di modellazione e la distribuzione per le colonne continue.
La definizione di una colonna della struttura di data mining deve contenere le informazioni seguenti:
ID: nome univoco della colonna, spesso identico al nome. Non è possibile modificare questo elemento dopo avere creato la struttura di data mining, mentre è possibile modificare il nome.
Nome: nome o alias della colonna.
Contenuto: enumerazione che descrive se i dati sono discreti o continui.
Tipo: enumerazione che indica il tipo di dati generale.
Distribuzione: enumerazione che descrive la distribuzione prevista dei valori. Una distribuzione viene inclusa se la colonna è continua.
Flag di modellazione: enumerazione che indica come gestire valori mancanti e così via. È anche possibile definire flag di modellazione nel modello di data mining, ma i flag del modello sono diversi da quelli utilizzati nelle colonne della struttura.
Associazioni: proprietà che specificano i dati di origine.
Gli algoritmi di terze parti possono includere inoltre proprietà personalizzate che è possibile definire nella colonna della struttura di data mining.
Per altre informazioni sulla struttura di data mining e sul modello di data mining, vedere Strutture di data mining (Analysis Services - Data Mining).
Contenuto correlato
Per ulteriori informazioni su come definire e utilizzare le colonne della struttura di data mining, vedere gli argomenti seguenti:
Argomento | Collegamenti |
---|---|
Vengono descritti i tipi di dati che è possibile utilizzare per definire una colonna della struttura di data mining. | Tipi di dati (data mining) |
Vengono descritti i tipi di contenuto disponibili per ogni tipo di dati contenuto in una colonna della struttura di data mining. I tipi di contenuto sono dipendenti dal tipo di dati. Il tipo di contenuto è assegnato a livello del modello e determina la modalità di utilizzo dei dati della colonna nel modello. | Tipi di contenuto (Data mining) |
Viene introdotto il concetto di tabelle nidificate e viene illustrato in che modo è possibile aggiungere le tabelle nidificate all'origine dati come colonne della struttura di data mining. | Colonne classificate (data mining) |
Vengono elencate e illustrate le proprietà di distribuzione che è possibile impostare in una colonna della struttura di data mining per specificare la distribuzione prevista di valori nella colonna. | Distribuzioni delle colonne (Data mining) |
Viene illustrato il concetto di discretizzazione (talvolta definito suddivisione in contenitori) e vengono descritti i metodi forniti in Analysis Services per discretizzare dati numerici continui. | Metodi di discretizzazione (data mining) |
Vengono descritti i flag di modellazione che è possibile impostare in una colonna della struttura di data mining. | Flag di modellazione (data mining) |
Vengono descritte le colonne classificate, un tipo speciale di colonna, che è possibile utilizzare per correlare una colonna della struttura di data mining a un'altra. | Colonne classificate (data mining) |
Vengono fornite informazioni sull'aggiunta e la modifica delle colonne della struttura di data mining. | Attività e procedure relative alla struttura di data mining |
Vedere anche
Strutture di data mining (Analysis Services – Data mining)
Colonne del modello di data mining