Esercitazione di base sul data mining
Introduzione all'esercitazione di base sul data mining di Microsoft Analysis Services. Microsoft SQL Server offre un ambiente integrato per la creazione di modelli di data mining e l'esecuzione di stime. In questa esercitazione verrà completato uno scenario per una campagna di mailing diretto in cui verrà utilizzato l'apprendimento automatico per analizzare e identificare il comportamento di acquisto dei clienti. Verrà illustrato come utilizzare tre degli algoritmi di data mining più importanti: clustering, alberi delle decisioni e Naive Bayes. Si apprenderà anche come analizzare i risultati usando i visualizzatori del modello di data mining e creare stime e grafici di accuratezza usando gli strumenti di data mining inclusi in Microsoft SQL Server Analysis Services. La società fittizia Adventure Works Cycles viene usata per tutti gli esempi.
Quando si ha familiarità con gli strumenti di data mining, è consigliabile completare anche l'Esercitazione intermedia sul data mining (Analysis Services - Data mining). Nelle lezioni viene illustrato come utilizzare le previsioni, l'analisi Market basket, la serie temporale, i modelli di associazione, le tabelle nidificate e il clustering delle sequenze.
Scenario dell'esercitazione
In questa esercitazione si è un dipendente di Adventure Works Cycles a cui è stato richiesto di saperne di più sui clienti dell'azienda in base agli acquisti cronologici e quindi usare tali dati cronologici per eseguire stime che possono essere usate nel marketing. L'azienda non ha mai eseguito operazioni di data mining, quindi è necessario creare un nuovo database specifico e impostare diversi modelli di data mining.
Lezioni dell'esercitazione
Questa esercitazione spiega come creare e utilizzare diversi tipi di metodi di apprendimento automatici. Verrà inoltre illustrato come creare la copia di un modello di data mining e come applicare un filtro ai dati di input per ottenere risultati diversi. Successivamente, sarà possibile confrontare i risultati di entrambi i modelli utilizzando un grafico di accuratezza. Infine, verrà utilizzata la funzione di drill-through per recuperare dati aggiuntivi dalla struttura di data mining sottostante.
Il data mining di Microsoft Analysis Services include le funzionalità seguenti che consentono di sviluppare e confrontare facilmente più modelli predittivi e quindi di eseguire azioni sui risultati:
Set di test di controllo -Quando si crea una struttura di data mining, è ora possibile dividere i dati nella struttura di data mining in set di training e di test. Ciò consente di testare i modelli in base a set di dati simili e di confrontare l'accuratezza di modelli correlati.
Filtri dei modelli di data mining -È ora possibile associare filtri a un modello di data mining e applicare il filtro durante il training e il test. Ciò consente di compilare facilmente modelli correlati in base a subset di dati diversi.
Drill-through in case struttura e colonne della struttura - È ora possibile passare facilmente dai modelli generali nel modello di data mining ai dettagli interattivi nell'origine dati.
L'esercitazione è suddivisa nelle lezioni seguenti:
Lezione 1: Preparazione del database di Analysis Services (Esercitazione di base sul data mining)
In questa lezione si apprenderà come creare un nuovo database di Analysis Services, aggiungere un'origine dati e una vista origine dati e preparare il nuovo database da usare con il data mining.
Lezione 2: Compilazione di una struttura di mailing diretto (Esercitazione di base sul data mining)
In questa lezione verranno illustrate le procedure per la creazione di una struttura di modello di data mining che può essere utilizzata nello scenario relativo al mailing diretto.
Lezione 3: Aggiunta ed elaborazione di modelli
In questa lezione verranno illustrate le procedure per l'aggiunta di modelli a una struttura. I modelli creati verranno compilati con gli algoritmi seguenti:
Microsoft Decision Trees
Microsoft Clustering
Microsoft Naive Bayes
Lezione 4: Esplorazione dei modelli di mailing diretto (Esercitazione di base sul data mining)
In questa lezione verranno illustrate le procedure per l'esplorazione e l'interpretazione dei risultati di ogni modello mediante i visualizzatori.
Lezione 5: Test di modelli (Esercitazione di base sul data mining)
In questa lezione verranno illustrate le procedure per creare una copia di uno dei modelli di mailing diretto, aggiungere un filtro del modello di data mining per limitare i dati di training a un particolare set di clienti e valutare l'affidabilità del modello.
Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)
In questa lezione finale dell'esercitazione di base sul data mining si utilizzerà il modello per individuare i clienti che con maggiore probabilità acquisteranno una bicicletta. Verrà quindi eseguito il drill-through nei case sottostanti per ottenere informazioni di contatto.
Requisiti
Verificare che sia installato quanto segue:
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services in modalità multidimensionale
Database AdventureWorksDW2012 .
Per migliorare la sicurezza, i database di esempio non vengono installati con SQL Server. Per installare i database ufficiali per Microsoft SQL Server, visitare la pagina Database di esempio Microsoft SQL e selezionare SQL Server 2014.
Nota
Quando si esegue un'esercitazione, è possibile che sia più semplice spostarsi avanti e indietro tra i passaggi se si aggiungono i pulsanti Argomento successivo e Argomento precedente alla barra degli strumenti del visualizzatore documenti.
Vedere anche
Soluzioni di data mining
Attività e procedure relative al modello di data mining
Creazione ed esecuzione di query sui modelli di data mining con DMX: esercitazioni (Analysis Services - Data mining)