Esercitazione intermedia sul data mining (Analysis Services - Data mining)
Microsoft Analysis Services offre un ambiente integrato per la creazione e l'uso di modelli di data mining. È possibile eseguire facilmente l'associazione a origini dati, creare e testare più modelli sugli stessi dati e distribuire modelli da utilizzare nelle analisi predittive.
Nell'esercitazione di base sul data mining si è appreso come usare SQL Server Data Tools (SSDT) per creare una soluzione di data mining e sono stati creati tre modelli per supportare una campagna di mailing mirata per l'analisi del comportamento di acquisto dei clienti e la destinazione di potenziali acquirenti.
Questa esercitazione intermedia viene compilata su tale esperienza acquisita e introduce diversi nuovi scenari, inclusi i requisiti aziendali comuni come la previsione e il Market basket analysis. Durante l'esercitazione verrà illustrato come creare un modello Time Series, un modello di associazione e un modello Sequence Clustering. Infine, verrà illustrato come utilizzare la rete neurale per esplorare le correlazioni dei dati e per utilizzare la regressione logistica per le stime.
Le lezioni sono indipendenti e possono essere completate separatamente.
Per completare le esercitazioni seguenti, l'utente deve avere familiarità con gli strumenti di data mining e con i visualizzatori dei modelli di data mining descritti nell'esercitazione di base sul data mining.
Tutti gli scenari usano l'origine dati AdventureWorksDW2012 , ma verranno create viste origine dati diverse per scenari diversi. È possibile completare le lezioni in qualsiasi ordine, purché si crei innanzitutto l'origine dati.
Scenari della lezione
Dopo la conclusione positiva della campagna di mailing diretto, si supponga di aver ricevuto la richiesta di sfruttare le proprie conoscenze di data mining per sviluppare diversi nuovi modelli da utilizzare nella pianificazione aziendale. Di seguito vengono descritte alcune di queste attività:
Previsione: Si creerà un modello time series per prevedere le vendite di prodotti in aree diverse in tutto il mondo. Si svilupperanno singoli modelli per ogni area e si apprenderà come usare la stima incrociata.
Analisi del carrello di mercato: Si creerà un modello di associazione, per analizzare i raggruppamenti di prodotti acquistati durante le visite al sito di e-commerce Adventure Works Cycles. Questo modello di analisi degli acquisti può essere utilizzato per consigliare prodotti ai clienti.
Analisi sequenza: Si crea un modello sequence clustering per analizzare l'ordine in cui i clienti acquistano prodotti. Sulla base di questo modello è possibile pianificare le modifiche alla progettazione del sito Web o le nuove offerte di prodotti.
Analisi dei fattori: Si usa un modello di rete neurale per esplorare le possibili cause di scarsa qualità del servizio nei dati del call center. In base alle informazioni dettagliate del modello preliminare, si creerà un modello di regressione logistica per stimare le strategie per migliorare l'esperienza dei clienti.
Lezioni dell'esercitazione
In questa esercitazione viene illustrato come creare e utilizzare tipi diversi di algoritmi di data mining. L'esercitazione è suddivisa nelle lezioni seguenti:
Lezione 1: Creazione della soluzione intermedia di data mining (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un nuovo progetto basato sul database AdventureWorksDW2012 per supportare diverse nuove viste origini dati e molti altri modelli di data mining.
Lezione 2: Compilazione di uno scenario di previsione (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di previsione. Verranno anche esaminati i modelli di data mining creati con l'algoritmo Microsoft Time Series.
Verranno compilati modelli per le singole aree geografiche, oltre a un modello generale che può essere utilizzato per la stima incrociata.
Lezione 3: Compilazione di uno scenario Market Basket (Esercitazione intermedia sul data mining)
In questa lezione verrà aggiunta una nuova vista origine dati e verrà illustrato come utilizzare le chiavi e le tabelle nidificate. In base a questi dati, verrà creato un modello di data mining che può essere utilizzato in uno scenario di analisi degli acquisti. Verranno inoltre esaminati i modelli di data mining compilati con l'algoritmo Microsoft Association.
Lezione 4: Compilazione di uno scenario di clustering delle sequenze (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di clustering delle sequenze. Si apprenderà anche come esplorare i modelli di data mining creati con l'algoritmo Microsoft Sequence Clustering.
Lezione 5: Compilazione dei modelli di rete neurale e di regressione logistica (Esercitazione intermedia sul data mining)
In questa lezione si creeranno alcuni modelli di data mining correlati, utilizzando Microsoft Neural Network e gli algoritmi di Microsoft Logistic Regression. Si apprenderà inoltre a utilizzare le viste origine dati per esplorare i dati sottostanti i modelli.
Requisiti
Verificare che sia installato quanto segue:
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services
SQL Server con il database AdventureWorksDW2012.
Per una maggiore sicurezza, i database di esempio non vengono installati per impostazione predefinita. Per installare i database ufficiali per Microsoft SQL Server, visitare la pagina Database di esempio Microsoft SQL e selezionare la versione appropriata del database di esempio.
Vedere anche
Esercitazione di base sul data mining
Esercitazione su DMX per Bike Buyer
Esercitazione su DMX per Market Basket