Query di data mining
Le query di data mining sono utili per molti scopi. È possibile:
Applicare il modello ai nuovi dati per eseguire una o più stime. È possibile fornire valori di input come parametri o in un batch.
Ottenere un riepilogo statistico dei dati utilizzati per il training.
Estrarre schemi e regole o generare un profilo del case tipico che rappresenta uno schema nel modello.
Estrarre formule di regressione e altri calcoli che consentono di spiegare i modelli.
Ottenere i case adatti per uno schema particolare.
Recuperare dettagli su singoli case utilizzati nel modello, tra cui i dati non utilizzati nell'analisi.
Ripetere il training di un modello aggiungendo nuovi dati o eseguire una stima incrociata.
In questa sezione viene fornita una panoramica delle informazioni necessarie per iniziare a utilizzare le query di data mining. Vengono descritti i tipi di query che è possibile creare sugli oggetti di data mining, introdotti gli strumenti e i linguaggi delle query, nonché forniti collegamenti a esempi di query che è possibile creare sui modelli compilati utilizzando gli algoritmi disponibili in Data mining di SQL Server.
Informazioni sulle query di data mining
Interfacce e strumenti di query
Query per tipi diversi di modelli
Requisiti
Informazioni sulle query di data mining
Data Mining di Analysis Services supporta i tipi di query seguenti:
-
Query mediante le quali vengono eseguite inferenze in base agli schemi del modello e dai dati di input.
Query sul contenuto (Data mining)
Query mediante le quali vengono restituiti metadati, statistiche e altre informazioni sul modello stesso.
Query drill-through (Data mining)
Query mediante le quali è possibile recuperare i dati del case sottostanti per il modello o persino i dati della struttura che non è stata utilizzata nel modello.
Query di definizione dei dati (Data mining)
Query mediante le quali non vengono restituite informazioni dal modello, ma piuttosto vengono utilizzate per compilare modelli e strutture o per aggiornare i dati in un modello o una struttura.
Prima di creare query, è consigliabile acquisire familiarità con le differenze tra i modelli creati con ognuno degli algoritmi di data mining forniti da SQL Server.
Visualizzare ed esplorare ogni tipo di modello tramite i visualizzatori di data mining personalizzati forniti per ogni tipo di algoritmo. Per ulteriori informazioni, vedere Attività e procedure relative al visualizzatore modello di data mining.
Verificare il contenuto di ogni tipo di modello tramite Microsoft Generic Content Tree Viewer. Per interpretare queste informazioni, fare riferimento a Contenuto del modello di data mining (Analysis Services - Data mining).
Interfacce e strumenti di query
È possibile compilare in modo interattivo query di data mining tramite uno degli strumenti di query forniti da SQL Server. Il generatore delle query di stima con interfaccia grafica è disponibile sia in SQL Server Data Tools (SSDT) sia in SQL Server Management Studio. Se si utilizza il generatore delle query di stima per la prima volta, è consigliabile attenersi ai passaggi descritti in Esercitazione di base sul data mining per acquisire familiarità con l'interfaccia. Per una rapida panoramica dei passaggi, vedere la sezione relativa alla creazione di una query tramite Creare una query di stima utilizzando Generatore query di stima.
Il generatore delle query di stima è utile per avviare le query che verranno personalizzate in un secondo momento. È possibile aggiungere facilmente origini dati ed eseguire il relativo mapping alle colonne, quindi passare alla vista DMX e personalizzare la query aggiungendo una clausola WHERE o altre funzioni.
Una volta acquisita familiarità con i modelli di data mining e con la compilazione di query, queste ultime possono anche essere scritte direttamente tramite DMX (Data Mining Extensions). DMX è un linguaggio di query simile a Transact-SQL che può essere utilizzato da molti client diversi ed è lo strumento ideale per la creazione sia di stime personalizzate sia di query complesse. Per un'introduzione a DMX, vedere Creazione ed esecuzione di query sui modelli di data mining con DMX: esercitazioni (Analysis Services - Data mining).
Gli editor DMX sono forniti sia in SQL Server Data Tools (SSDT) sia in SQL Server Management Studio. Il generatore delle query di stima può essere utilizzato anche per avviare le query, quindi per modificare la vista nell'editor di testo e copiare l'istruzione DMX in un altro client. Per ulteriori informazioni, vedere Interfacce di query di data mining.
È possibile comporre a livello di codice istruzioni DMX e inviarle dal client al server Analysis Services tramite AMO o XMLA. Tuttavia, DMX è il linguaggio che è necessario utilizzare per creare query su un modello di data mining.
È inoltre possibile eseguire una query sui metadati, sulle statistiche o su parte del contenuto del modello tramite DMV basate sui set di righe dello schema di data mining. Queste DMV facilitano il recupero delle informazioni sul modello tramite la digitazione di istruzioni SELECT; tuttavia non è possibile creare stime. Per ulteriori informazioni sulle DMV supportate da Analysis Services, vedere Utilizzare DMV per monitorare Analysis Services.
Infine, è possibile creare query di data mining da utilizzare nei pacchetti di Integration Services tramite l'Attività Query di data mining o la Trasformazione Query di data mining. L'attività del flusso di controllo supporta più tipi di query DMX, mentre la trasformazione del flusso di dati supporta solo le query che vengono utilizzate nei dati del flusso di dati, ovvero le query in cui viene utilizzata la sintassi PREDICTION JOIN.
Query per tipi diversi di modelli
L'algoritmo utilizzato durante la creazione del modello influenza ampiamente il tipo di informazioni che è possibile ottenere da una query di data mining. Il motivo di tali differenze consiste nel fatto che ogni algoritmo consente di elaborare i dati in modo differente e di archiviare tipi diversi di modelli. Ad esempio, alcuni algoritmi consentono di creare cluster, altri invece alberi. Pertanto, potrebbe essere necessario utilizzare funzioni di stima e di query specifiche, a seconda del tipo di modello in uso.
Nell'elenco seguente viene fornito un riepilogo delle funzioni che è possibile utilizzare nelle query:
Funzioni di stima generali: la funzione Predict è polimorfica, ovvero può essere utilizzata in tutti i tipi di modelli. Questa funzione consentirà di rilevare automaticamente il tipo di modello in uso. Per tale funzione verrà richiesto di aggiungere ulteriori parametri. Per ulteriori informazioni, vedere Predict (DMX).
Attenzione Non tutti i modelli vengono utilizzati per eseguire stime. Ad esempio, è possibile creare un modello di clustering che non dispone di un attributo stimabile. Tuttavia, anche se un modello non dispone di un attributo stimabile, è possibile creare query di stima tramite cui vengono restituiti altri tipi di informazioni utili dal modello.
Funzioni di stima personalizzate: in ogni tipo di modello è disponibile un set di funzioni di stima progettate per essere utilizzate con gli schemi creati da tale algoritmo.
Ad esempio, la funzione Lag è fornita per i modelli Time Series, per consentire di visualizzare i dati cronologici utilizzati per il modello. Per i modelli di clustering, le funzioni come ClusterDistance sono più significative.
Per ulteriori informazioni sulle funzioni supportate per ogni tipo di modello, vedere i collegamenti seguenti:
È anche possibile chiamare le funzioni VBA o creare delle proprie funzioni. Per ulteriori informazioni, vedere Funzioni (DMX).
Statistiche generali: esistono alcune funzioni che possono essere utilizzate con quasi ogni tipo di modello e tramite cui viene restituito un set standard di statistiche descrittive, ad esempio la deviazione standard.
Ad esempio, tramite la funzione PredictHistogram viene restituita una tabella in cui sono elencati tutti gli stati della colonna specificata.
Per ulteriori informazioni, vedere Funzioni di stima correlate (DMX).
Statistiche personalizzate: vengono fornite funzioni di supporto aggiuntive per ogni tipo di modello per generare statistiche attinenti all'attività analitica specifica.
Ad esempio, quando si utilizza un modello di clustering, è possibile utilizzare la funzione PredictCaseLikelihood per restituire il punteggio di probabilità associato a un determinato case e a un cluster. Tuttavia, se è stato creato un modello di regressione lineare, sarebbe più utile recuperare il coefficiente e intercettarlo utilizzando una query sul contenuto.
Funzioni relative al contenuto del modello: il contenuto di tutti i modelli viene rappresentato in un formato standardizzato che consente di recuperare le informazioni con una query semplice. È possibile creare query sul contenuto del modello tramite DMX. È anche possibile ottenere alcuni tipi di contenuto del modello utilizzando i set di righe dello schema di data mining.
Nel contenuto del modello, il significato di ogni riga o nodo della tabella restituito differisce a seconda del tipo di algoritmo utilizzato per compilare il modello, nonché del tipo di dati della colonna. Per ulteriori informazioni, vedere Query sul contenuto (Data mining).
Requisiti
Prima che sia possibile creare una query su un modello, deve essere stato elaborato il modello di data mining. Per l'elaborazione degli oggetti Analysis Services sono necessarie autorizzazioni speciali. Per ulteriori informazioni sull'elaborazione dei modelli di data mining, vedere Requisiti e considerazioni sull'elaborazione (data mining).
Per eseguire query su un modello di data mining sono necessari diversi livelli di autorizzazioni, a seconda del tipo di query in esecuzione. Ad esempio, l'esecuzione del drill-through ai dati del case o della struttura richiede in genere autorizzazioni aggiuntive che possono essere impostate sull'oggetto della struttura o del modello di data mining.
Tuttavia, se nella query vengono utilizzati dati esterni e sono incluse istruzioni quali OPENROWSET o OPENQUERY, il database sul quale si sta eseguendo una query deve consentire l'abilitazione di queste istruzioni ed è necessario disporre dell'autorizzazione per gli oggetti di database sottostanti.
Per ulteriori informazioni sui contesti di sicurezza richiesti per eseguire query di data mining, vedere Panoramica della sicurezza (data mining)
Contenuto della sezione
Negli argomenti di questa sezione viene presentato dettagliatamente ogni tipo di query di data mining e vengono forniti collegamenti a esempi dettagliati di creazione di query sui modelli di data mining.
Query sul contenuto (Data mining)
Query drill-through (Data mining)
Query di definizione dei dati (Data mining)
Interfacce di query di data mining
Attività correlate
Utilizzare questi collegamenti per informazioni sulla creazione e sull'utilizzo di query di data mining.
Vedere anche
Concetti
Algoritmi di data mining (Analysis Services - Data mining)
Contenuto del modello di data mining (Analysis Services - Data mining)