Requisiti e considerazioni sull'elaborazione (data mining)

Articolo
06/13/2017

In questo argomento vengono illustrate alcune considerazioni tecniche da tenere presenti quando si elaborano oggetti di data mining. Per una spiegazione generale dell'elaborazione e della modalità di applicazione al data mining, vedere Elaborazione di oggetti di data mining.

Query sull'archivio relazionale

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Query sull'archivio relazionale durante l'elaborazione

Per il data mining, l'elaborazione prevede tre fasi: esecuzione di query sui dati di origine, determinazione di statistiche non elaborate e utilizzo della definizione e dell'algoritmo del modello per eseguire il training del modello di data mining.

Il server Analysis Services esegue query sul database che fornisce i dati non elaborati. Questo database potrebbe essere un'istanza di SQL Server 2014 o una versione precedente del motore di database SQL Server. Quando si elabora una struttura di data mining, i dati presenti nell'origine vengono trasferiti nella struttura di data mining e resi persistenti su disco in un nuovo formato compresso. Non tutte le colonne dell'origine dati vengono elaborate, ma solo quelle incluse nella struttura di data mining, come definito dalle associazioni.

Con questi dati, in Analysis Services viene compilato un indice di tutti i dati e le colonne discretizzate e viene creato un indice separato per le colonne continue. Per ogni tabella nidificata, viene eseguita una query per creare l'indice e viene generata una query aggiuntiva per elaborare le relazioni tra ogni coppia di tabella nidificata e tabella del case. La creazione di più query è necessaria per elaborare uno speciale archivio dati multidimensionale interno. È possibile limitare il numero di query inviate da Analysis Services all'archivio relazionale impostando la proprietà del server, DatabaseConnectionPoolMax. Per altre informazioni, vedere Proprietà OLAP.

Quando si elabora il modello, quest'ultimo non legge nuovamente i dati dall'origine dati, ma ne ottiene il riepilogo dalla struttura di data mining. Utilizzando il cubo creato e i dati dell'indice e del case memorizzati nella cache, nel server vengono creati thread indipendenti per eseguire il training dei modelli.

Per altre informazioni sulle edizioni di SQL Server che supportano l'elaborazione di modelli paralleli, vedere Funzionalità supportate dalle edizioni di SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Elaborazione di strutture di data mining

È possibile elaborare una struttura di data mining insieme a tutti i modelli dipendenti o separatamente. L'elaborazione di una struttura di data mining separatamente dai modelli può essere utile quando si prevede che l'elaborazione di alcuni modelli richieda molto tempo e si desidera rinviare tale operazione.

Per altre informazioni, vedere Elaborare una struttura di data mining.

Se si è preoccupati di conservare lo spazio su disco rigido, si noti che Analysis Services mantiene le cache della struttura di data mining in locale. Ciò significa che tutti i dati di training vengono scritti nel disco rigido locale. Se non si desidera memorizzare i dati nella cache, è possibile modificare il comportamento predefinito impostando la proprietà MiningStructureCacheMode nella struttura di data mining su ClearAfterProcessing. La cache verrà eliminata dopo l'elaborazione dei modelli; tuttavia, verrà anche disabilitato il drill-through sulla struttura di data mining. Per altre informazioni, vedere Query drill-through (data mining).

Inoltre, se si cancella la cache, non sarà possibile utilizzare il set di test di controllo eventualmente specificato e la definizione della partizione del set di test andrà persa. Per altre informazioni sui set di test di blocco, vedere Set di dati di training e test.

Elaborazione di modelli di data mining

È possibile elaborare un modello di data mining separatamente dalla struttura di data mining associata oppure elaborare tutti i modelli basati sulla struttura insieme alla struttura stessa.

Per altre informazioni, vedere Elaborare un modello di data mining.

Tuttavia, in SQL Server Data Tools (SSDT) e SQL Server Management Studio non è possibile selezionare più modelli di data mining da elaborare con la struttura. Se è necessario controllare quali modelli vengono elaborati, è necessario selezionarli singolarmente o utilizzare XMLA o DMX per elaborarli in serie.

Necessità di rielaborazione

È necessario elaborare i modelli di Analysis Services definiti prima di iniziare a usarli. È inoltre necessario rielaborare i modelli di data mining ogni volta che si modifica la struttura del modello di data mining, si aggiornano i dati di training, si modifica un modello di data mining esistente oppure si aggiunge un nuovo modello di data mining alla struttura.

I modelli di data mining vengono inoltre elaborati in questi scenari:

Distribuzione di un progetto: in base alle impostazioni e allo stato corrente del progetto, i modelli di data mining in esso contenuti sono in genere elaborati completamente al momento della distribuzione del progetto.

Quando si avvia la distribuzione, l'elaborazione viene avviata automaticamente, a meno che non sia presente una versione elaborata in precedenza nel server Analysis Services e non siano state apportate modifiche strutturali. È possibile distribuire un progetto selezionando Distribuisci soluzione nell'elenco a discesa o premendo F5. È possibile

Per altre informazioni su come impostare le proprietà di distribuzione di Analysis Services che controllano la distribuzione dei modelli di data mining, vedere Distribuzione di soluzioni di data mining.

Spostamento di un modello di data mining: quando si sposta un modello di data mining tramite il comando EXPORT, viene esportata solo la definizione del modello, incluso il nome della struttura di data mining che si prevede fornisca i dati al modello.

Requisiti di rielaborazione per gli scenari seguenti utilizzando i comandi EXPORT e IMPORT:

La struttura di data mining esiste nell'istanza di destinazione e la struttura di data mining è in uno stato non elaborato.

È necessario rielaborare sia la struttura sia il modello.
La struttura di data mining esiste nell'istanza di destinazione ed è stata elaborata. È stato esportato solo il modello di data mining.

Il modello può essere utilizzato senza elaborazione.
È inoltre stata esportata la definizione della struttura di data mining tramite la parola chiave WITH DEPENDENCIES.

È necessario rielaborare sia la struttura sia il modello.

Per altre informazioni, vedere Esportare e importare gli oggetti di data mining.

Vedere anche

Strutture di data mining (Analysis Services – Data mining)
Strutture di data mining (Analysis Services – Data mining)
Elaborazione di oggetti del modello multidimensionale

Condividi tramite

Requisiti e considerazioni sull'elaborazione (data mining)

Query sull'archivio relazionale durante l'elaborazione

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Necessità di rielaborazione

Vedere anche

Risorse aggiuntive