Esercitazione intermedia sul data mining (Analysis Services - Data mining)
MicrosoftAnalysis Services offre un ambiente integrato per la creazione e l'utilizzo di modelli di data mining. È possibile eseguire facilmente l'associazione a origini dati, creare e testare più modelli sugli stessi dati e distribuire modelli da utilizzare nelle analisi predittive.
Nell'esercitazione di base sul data mining è stato descritto come utilizzare Business Intelligence Development Studio per creare una soluzione di data mining e sono stati generati tre modelli a supporto di una campagna di mailing diretto per analizzare il comportamento di acquisto dei clienti e per individuare i potenziali acquirenti.
In questa esercitazione si presuppone che l'utente abbia familiarità con gli strumenti di data mining e con i visualizzatori modelli di data mining presentati nell'esercitazione di base sul data mining. Questa esercitazione intermedia si basa su tale esperienza acquisita e introduce diversi nuovi scenari, incluse le previsione e le analisi di mercato sugli acquisti. In questa esercitazione verrà illustrato come creare un modello Time Series, un modello di associazione e un modello Sequence Clustering. Verrà inoltre descritto come utilizzare tabelle nidificate in un modello e come creare filtri sulle tabelle nidificate.
In tutti gli scenari viene utilizzata l'origine dati AdventureWorksDW2008, tuttavia verranno create viste origine dati diverse per i diversi scenari. È possibile completare le lezioni in qualsiasi ordine, purché si crei innanzitutto l'origine dati.
Le lezioni sono indipendenti e possono essere completate separatamente.
Scenari della lezione
Dopo la conclusione positiva della campagna di mailing diretto, si supponga di aver ricevuto la richiesta di sfruttare le proprie conoscenze di data mining per sviluppare diversi nuovi modelli da utilizzare nella pianificazione aziendale. Tali modelli includono i seguenti nuovi tipi:
Modelli Time Series, per prevedere le vendite di prodotti nelle diverse aree geografiche in tutto il mondo. Verranno sviluppati singoli modelli per ogni area, oltre a un modello generale che può essere utilizzato per la stima incrociata.
Modello di associazione, per analizzare raggruppamenti di prodotti acquistati durante le visite al sito e-commerce di Adventure Works Cycles. Questo modello di analisi degli acquisti può essere utilizzato per consigliare prodotti ai clienti.
Modello Sequence Clustering, per analizzare l'ordine in cui i clienti acquistano i prodotti. Sulla base di questo modello è possibile pianificare le modifiche alla progettazione del sito Web o le nuove offerte di prodotti.
Lezioni dell'esercitazione
In questa esercitazione verrà illustrato come creare e utilizzare tipi diversi di algoritmi di data mining. Verranno inoltre illustrati i seguenti concetti:
Utilizzo di tabelle nidificate per la generazione di modelli
Scelta di una chiave di tabella nidificata, della serie temporale o di sequenza
Applicazione di filtri alle tabelle nidificate durante la creazione di modelli o l'esecuzione di stime
Verifica che i dati disponibili siano sufficienti per supportare un modello
Creazione di un modello generale e applicazione a più set di dati
L'esercitazione è suddivisa nelle lezioni seguenti:
Lezione 1: Creazione della soluzione intermedia di data mining (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un nuovo progetto basato sul database AdventureWorksDW 2008, per supportare diverse nuove viste origine dati e molti più modelli di data mining.Lezione 2: Creazione di uno scenario di previsione (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di previsione. Verranno inoltre esplorati i modelli di data mining creati con l'algoritmo Microsoft Time Series.Verranno creati modelli per le singole aree geografiche, oltre a un modello generale che può essere utilizzato per la stima incrociata.
Lezione 3: Creazione di uno scenario Market Basket (Esercitazione intermedia sul data mining)
In questa lezione verrà aggiunta una nuova vista origine dati e verrà illustrato come utilizzare le chiavi e le tabelle nidificate. In base a questi dati, verrà creato un modello di data mining che può essere utilizzato in uno scenario di analisi degli acquisti. Verranno inoltre esplorati i modelli di data mining creati con l'algoritmo Microsoft Association.Lezione 4: Creazione di uno scenario di clustering delle sequenze (Esercitazione intermedia sul data mining)
In questa lezione verrà creato un modello di data mining che può essere utilizzato in uno scenario di clustering delle sequenze. Verranno inoltre esaminati i modelli di data mining basati sull'algoritmo Microsoft Sequence Clustering.Lezione 5: Creazione dei modelli di rete neurale e di regressione logistica (Esercitazione intermedia sul data mining)
In questa lezione verranno analizzati i dati di un call center per migliorare il livello di soddisfazione dei clienti. Verrà utilizzato l'algoritmo Microsoft Neural Network per generare un modello che consentirà di comprendere i dati e le relative tendenze. Verrà inoltre creato un modello di regressione logistica per eseguire stime che è possibile utilizzare nelle pianificazioni aziendali.
Requisiti
Verificare che siano installati i componenti seguenti:
MicrosoftSQL Server 2008
MicrosoftSQL ServerAnalysis Services
SQL Server con il database AdventureWorks DW2008.
Per una maggiore protezione, i database di esempio non vengono installati per impostazione predefinita. Per installare i database ufficiali per MicrosoftSQL Server, visitare la pagina Web Microsoft SQL Sample Databases e selezionare AdventureWorksDW2008.
[!NOTA]
Quando si esegue un'esercitazione, può risultare più agevole spostarsi avanti e indietro nei passaggi se si aggiungono i pulsanti Argomento successivo e Argomento precedente nella barra degli strumenti del visualizzatore di documenti. Per ulteriori informazioni, vedere Aggiunta dei pulsanti Argomento precedente e Argomento successivo alla Guida.
Vedere anche