Condividi tramite


Query di data mining

Le query di data mining sono utili per molti scopi. È possibile:

  • Applicare il modello ai nuovi dati per eseguire una o più stime. È possibile fornire valori di input come parametri o in un batch.

  • Ottenere un riepilogo statistico dei dati utilizzati per il training.

  • Estrarre schemi e regole o generare un profilo del case tipico che rappresenta uno schema nel modello.

  • Estrarre formule di regressione e altri calcoli che consentono di spiegare i modelli.

  • Ottenere i case adatti per uno schema particolare.

  • Recuperare dettagli su singoli case utilizzati nel modello, tra cui i dati non utilizzati nell'analisi.

  • Ripetere il training di un modello aggiungendo nuovi dati o eseguire una stima incrociata.

In questa sezione viene fornita una panoramica delle informazioni necessarie per iniziare a utilizzare le query di data mining. Vengono descritti i tipi di query che è possibile creare sugli oggetti di data mining, introdotti gli strumenti e i linguaggi delle query, nonché forniti collegamenti a esempi di query che è possibile creare sui modelli compilati utilizzando gli algoritmi disponibili in Data mining di SQL Server.

Informazioni sulle query di data mining

Interfacce e strumenti di query

Query per tipi diversi di modelli

Requisiti

Informazioni sulle query di data mining

Data Mining di Analysis Services supporta i tipi di query seguenti:

  • Query di stima (Data mining)

    Query mediante le quali vengono eseguite inferenze in base agli schemi del modello e dai dati di input.

  • Query sul contenuto (Data mining)

    Query mediante le quali vengono restituiti metadati, statistiche e altre informazioni sul modello stesso.

  • Query drill-through (Data mining)

    Query mediante le quali è possibile recuperare i dati del case sottostanti per il modello o persino i dati della struttura che non è stata utilizzata nel modello.

  • Query di definizione dei dati (Data mining)

    Query mediante le quali non vengono restituite informazioni dal modello, ma piuttosto vengono utilizzate per compilare modelli e strutture o per aggiornare i dati in un modello o una struttura.

Prima di creare query, è consigliabile acquisire familiarità con le differenze tra i modelli creati con ognuno degli algoritmi di data mining forniti da SQL Server.

Interfacce e strumenti di query

È possibile compilare in modo interattivo query di data mining tramite uno degli strumenti di query forniti da SQL Server. Il generatore delle query di stima con interfaccia grafica è disponibile sia in SQL Server Data Tools (SSDT) sia in SQL Server Management Studio. Se si utilizza il generatore delle query di stima per la prima volta, è consigliabile attenersi ai passaggi descritti in Esercitazione di base sul data mining per acquisire familiarità con l'interfaccia. Per una rapida panoramica dei passaggi, vedere la sezione relativa alla creazione di una query tramite Creare una query di stima utilizzando Generatore query di stima.

Il generatore delle query di stima è utile per avviare le query che verranno personalizzate in un secondo momento. È possibile aggiungere facilmente origini dati ed eseguire il relativo mapping alle colonne, quindi passare alla vista DMX e personalizzare la query aggiungendo una clausola WHERE o altre funzioni.

Una volta acquisita familiarità con i modelli di data mining e con la compilazione di query, queste ultime possono anche essere scritte direttamente tramite DMX (Data Mining Extensions). DMX è un linguaggio di query simile a Transact-SQL che può essere utilizzato da molti client diversi ed è lo strumento ideale per la creazione sia di stime personalizzate sia di query complesse. Per un'introduzione a DMX, vedere Creazione ed esecuzione di query sui modelli di data mining con DMX: esercitazioni (Analysis Services - Data mining).

Gli editor DMX sono forniti sia in SQL Server Data Tools (SSDT) sia in SQL Server Management Studio. Il generatore delle query di stima può essere utilizzato anche per avviare le query, quindi per modificare la vista nell'editor di testo e copiare l'istruzione DMX in un altro client. Per ulteriori informazioni, vedere Interfacce di query di data mining.

È possibile comporre a livello di codice istruzioni DMX e inviarle dal client al server Analysis Services tramite AMO o XMLA. Tuttavia, DMX è il linguaggio che è necessario utilizzare per creare query su un modello di data mining.

È inoltre possibile eseguire una query sui metadati, sulle statistiche o su parte del contenuto del modello tramite DMV basate sui set di righe dello schema di data mining. Queste DMV facilitano il recupero delle informazioni sul modello tramite la digitazione di istruzioni SELECT; tuttavia non è possibile creare stime. Per ulteriori informazioni sulle DMV supportate da Analysis Services, vedere Utilizzare DMV per monitorare Analysis Services.

Infine, è possibile creare query di data mining da utilizzare nei pacchetti di Integration Services tramite l'Attività Query di data mining o la Trasformazione Query di data mining. L'attività del flusso di controllo supporta più tipi di query DMX, mentre la trasformazione del flusso di dati supporta solo le query che vengono utilizzate nei dati del flusso di dati, ovvero le query in cui viene utilizzata la sintassi PREDICTION JOIN.

Query per tipi diversi di modelli

L'algoritmo utilizzato durante la creazione del modello influenza ampiamente il tipo di informazioni che è possibile ottenere da una query di data mining. Il motivo di tali differenze consiste nel fatto che ogni algoritmo consente di elaborare i dati in modo differente e di archiviare tipi diversi di modelli. Ad esempio, alcuni algoritmi consentono di creare cluster, altri invece alberi. Pertanto, potrebbe essere necessario utilizzare funzioni di stima e di query specifiche, a seconda del tipo di modello in uso.

Nell'elenco seguente viene fornito un riepilogo delle funzioni che è possibile utilizzare nelle query:

  • Funzioni di stima generali: la funzione Predict è polimorfica, ovvero può essere utilizzata in tutti i tipi di modelli. Questa funzione consentirà di rilevare automaticamente il tipo di modello in uso. Per tale funzione verrà richiesto di aggiungere ulteriori parametri. Per ulteriori informazioni, vedere Predict (DMX).

    Nota di attenzioneAttenzione

    Non tutti i modelli vengono utilizzati per eseguire stime. Ad esempio, è possibile creare un modello di clustering che non dispone di un attributo stimabile. Tuttavia, anche se un modello non dispone di un attributo stimabile, è possibile creare query di stima tramite cui vengono restituiti altri tipi di informazioni utili dal modello.

  • Funzioni di stima personalizzate: in ogni tipo di modello è disponibile un set di funzioni di stima progettate per essere utilizzate con gli schemi creati da tale algoritmo.

    Ad esempio, la funzione Lag è fornita per i modelli Time Series, per consentire di visualizzare i dati cronologici utilizzati per il modello. Per i modelli di clustering, le funzioni come ClusterDistance sono più significative.

    Per ulteriori informazioni sulle funzioni supportate per ogni tipo di modello, vedere i collegamenti seguenti:

    Esempi di query sul modello di associazione

    Algoritmo Microsoft Naive Bayes

    Esempi di query sul modello di clustering

    Esempi di query sul modello di rete neurale

    Esempi di query sul modello di alberi delle decisioni

    Esempi di query sul modello di cluster di sequenza

    Esempi di query sul modello di regressione lineare

    Esempi di query sul modello di serie temporale

    Esempi di query sul modello di regressione logistica

    È anche possibile chiamare le funzioni VBA o creare delle proprie funzioni. Per ulteriori informazioni, vedere Funzioni (DMX).

  • Statistiche generali: esistono alcune funzioni che possono essere utilizzate con quasi ogni tipo di modello e tramite cui viene restituito un set standard di statistiche descrittive, ad esempio la deviazione standard.

    Ad esempio, tramite la funzione PredictHistogram viene restituita una tabella in cui sono elencati tutti gli stati della colonna specificata.

    Per ulteriori informazioni, vedere Funzioni di stima correlate (DMX).

  • Statistiche personalizzate: vengono fornite funzioni di supporto aggiuntive per ogni tipo di modello per generare statistiche attinenti all'attività analitica specifica.

    Ad esempio, quando si utilizza un modello di clustering, è possibile utilizzare la funzione PredictCaseLikelihood per restituire il punteggio di probabilità associato a un determinato case e a un cluster. Tuttavia, se è stato creato un modello di regressione lineare, sarebbe più utile recuperare il coefficiente e intercettarlo utilizzando una query sul contenuto.

  • Funzioni relative al contenuto del modello: il contenuto di tutti i modelli viene rappresentato in un formato standardizzato che consente di recuperare le informazioni con una query semplice. È possibile creare query sul contenuto del modello tramite DMX. È anche possibile ottenere alcuni tipi di contenuto del modello utilizzando i set di righe dello schema di data mining.

    Nel contenuto del modello, il significato di ogni riga o nodo della tabella restituito differisce a seconda del tipo di algoritmo utilizzato per compilare il modello, nonché del tipo di dati della colonna. Per ulteriori informazioni, vedere Query sul contenuto (Data mining).

Requisiti

Prima che sia possibile creare una query su un modello, deve essere stato elaborato il modello di data mining. Per l'elaborazione degli oggetti Analysis Services sono necessarie autorizzazioni speciali. Per ulteriori informazioni sull'elaborazione dei modelli di data mining, vedere Requisiti e considerazioni sull'elaborazione (data mining).

Per eseguire query su un modello di data mining sono necessari diversi livelli di autorizzazioni, a seconda del tipo di query in esecuzione. Ad esempio, l'esecuzione del drill-through ai dati del case o della struttura richiede in genere autorizzazioni aggiuntive che possono essere impostate sull'oggetto della struttura o del modello di data mining.

Tuttavia, se nella query vengono utilizzati dati esterni e sono incluse istruzioni quali OPENROWSET o OPENQUERY, il database sul quale si sta eseguendo una query deve consentire l'abilitazione di queste istruzioni ed è necessario disporre dell'autorizzazione per gli oggetti di database sottostanti.

Per ulteriori informazioni sui contesti di sicurezza richiesti per eseguire query di data mining, vedere Panoramica della sicurezza (data mining)

Contenuto della sezione

Negli argomenti di questa sezione viene presentato dettagliatamente ogni tipo di query di data mining e vengono forniti collegamenti a esempi dettagliati di creazione di query sui modelli di data mining.

Query di stima (Data mining)

Query sul contenuto (Data mining)

Query drill-through (Data mining)

Query di definizione dei dati (Data mining)

Interfacce di query di data mining

Attività correlate

Utilizzare questi collegamenti per informazioni sulla creazione e sull'utilizzo di query di data mining.

Attività

Collegamenti

Visualizzare esercitazioni e procedure dettagliate su query di data mining

Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)

Esercitazione su DMX per le stime basate su serie temporali

Utilizzare strumenti query di data mining in SQL Server Management Studio e SQL Server Data Tools (SSDT)

Creare una query DMX in SQL Server Management Studio

Creare una query di stima utilizzando Generatore query di stima

Applicare le funzioni di stima a un modello

Modificare manualmente un query di stima

Utilizzare i dati esterni presenti nelle query di stima

Scegliere ed eseguire il mapping di dati di input per una query di stima

Scegliere ed eseguire il mapping di dati di input per una query di stima

Utilizzo dei risultati delle query

Visualizzare e salvare i risultati di una query di stima

Utilizzare modelli di query DMX e XMLA forniti in Management Studio

Creare una query di stima singleton da un modello

Creare una query di data mining utilizzando XML/A

Utilizzare i modelli di Analysis Services in SQL Server Management Studio

Acquisire ulteriori informazioni sulle query sul contenuto e visualizzare esempi

Creare una query sul contenuto di un modello di data mining

Eseguire query sui parametri utilizzati per creare un modello di data mining

Query sul contenuto (Data mining)

Impostare opzioni di query e risolvere problemi relativi ad autorizzazioni ed errori attinenti alle query

Modificare il valore di timeout per le query di data mining

Utilizzare i componenti di data mining in Integration Services

Attività Query di data mining

Trasformazione Query di data mining

Vedere anche

Concetti

Algoritmi di data mining (Analysis Services - Data mining)

Contenuto del modello di data mining (Analysis Services - Data mining)