Condividi tramite


Esercitazione su DMX per Market Basket

In questa esercitazione vengono descritte le procedure per la creazione, il training e l'esplorazione dei modelli di data mining utilizzando il linguaggio di query DMX (Data Mining Extensions). Questi modelli di data mining verranno quindi utilizzati per la creazione di stime che indicano quali prodotti tendono a essere acquistati contemporaneamente.

I modelli di data mining verranno creati dai dati contenuti nel database di esempio AdventureWorksDW2012 , che archivia i dati per la società fittizia Adventure Works Cycles. Adventure Works Cycles è una grande azienda di produzione multinazionale. che produce e vende biciclette in metallo e a struttura mista per i mercati di America del nord, Europa e Asia. La sede operativa si trova a Bothell, nello stato di Washington, in cui lavorano 290 dipendenti, e la società dispone di numerosi reparti vendite dislocati nelle diverse aree di mercato a livello internazionale.

Scenario dell'esercitazione

Adventure Works Cycles ha deciso di creare un'applicazione personalizzata che utilizza funzionalità di data mining per prevedere i tipi di prodotti che i clienti tendono ad acquistare contemporaneamente. L'obiettivo dell'applicazione personalizzata consiste nella possibilità di specificare un set di prodotti e di stimare quali prodotti aggiuntivi verranno acquistati insieme a quelli specificati. Adventure Works Cycles userà quindi queste informazioni per aggiungere una funzionalità "suggerisci" al proprio sito Web e anche per organizzare meglio il modo in cui presentano informazioni ai propri clienti.

Microsoft SQL Server Analysis Services offre diversi strumenti che possono essere usati per eseguire questa attività:

  • Il linguaggio di query DMX

  • Algoritmo Microsoft Association

  • Editor di query in SQL Server Management Studio

Data Mining Extensions (DMX) è un linguaggio di query fornito da Analysis Services che è possibile usare per creare e usare modelli di data mining. L'algoritmo Microsoft Association crea modelli in grado di stimare i prodotti che potrebbero essere acquistati insieme.

Lo scopo di questa esercitazione consiste nel fornire le query DMX che verranno utilizzate nell'applicazione personalizzata.

Per altre informazioni: Soluzioni di data mining

Struttura e modelli di data mining

Prima di iniziare a creare istruzioni DMX, è importante comprendere gli oggetti principali usati da Analysis Services per creare modelli di data mining. La struttura di data mining è una struttura di dati che definisce il dominio di dati da cui vengono compilati i modelli di data mining. Una singola struttura di data mining può contenere più modelli di data mining che condividono lo stesso dominio. Un modello di data mining applica un algoritmo specifico ai dati rappresentati da una struttura di data mining.

Gli elementi di compilazione della struttura di data mining sono le relative colonne, che descrivono le informazioni contenute nell'origine dei dati. Tali colonne includono informazioni quali il tipo di dati, il tipo di contenuto e la modalità di distribuzione dei dati.

I modelli di data mining devono contenere la colonna chiave descritta nella struttura di data mining, nonché un subset delle colonne restanti. Il modello di data mining definisce l'utilizzo di ogni colonna e l'algoritmo utilizzato per creare il modello stesso. Ad esempio, in DMX è possibile specificare una colonna come colonna chiave o colonna PREDICT. Le colonne non specificate vengono considerate come colonne di input.

In DMX è possibile creare modelli di data mining in due modi, ovvero creando contemporaneamente una struttura di data mining e il modello di data mining associato mediante l'istruzione CREATE MINING MODEL oppure creando prima una struttura di data mining con l'istruzione CREATE MINING STRUCTURE e quindi aggiungendo un modello di data mining alla struttura mediante l'istruzione ALTER STRUCTURE. Questi metodi sono descritti di seguito.

CREATE MINING MODEL
Questa istruzione consente di creare contemporaneamente una struttura di data mining e il modello di data mining associato utilizzando lo stesso nome. Al nome del modello di data mining viene aggiunto il suffisso "Structure" per differenziarlo dalla struttura di data mining.

Questa istruzione è utile quando si crea una struttura di data mining che conterrà un unico modello di data mining.

Per altre informazioni, vedere CREATE MINING MODEL (DMX).

CREATE MINING STRUCTURE
Utilizzare questa istruzione per creare una nuova struttura di data mining senza modelli.

Quando si utilizza CREATE MINING STRUCTURE, è inoltre possibile creare un set di dati di controllo che può essere utilizzato per il testing dei modelli basati sulla stessa struttura di data mining.

Per altre informazioni, vedere CREATE MINING STRUCTURE (DMX).

ALTER MINING STRUCTURE
Questa istruzione consente di aggiungere un modello di data mining a una struttura di data mining già esistente sul server.

L'esigenza di aggiungere più modelli di data mining in un'unica struttura di data mining può essere dettata da numerose ragioni. È possibile ad esempio creare più modelli di data mining con algoritmi diversi per stabilire quale di essi funziona meglio oppure creare più modelli di data mining che utilizzano lo stesso algoritmo, ma impostando un parametro in modo diverso in ogni modello per individuare l'impostazione ottimale per il parametro.

Per altre informazioni, vedere ALTER MINING STRUCTURE (DMX).

In questa esercitazione si utilizzerà il secondo metodo poiché si creerà una struttura di data mining contenente diversi modelli di data mining.

Ulteriori informazioni

Informazioni di riferimento sulle estensioni di data mining (DMX), informazioni sull'istruzione Select DMX, la struttura e l'utilizzo delle query di stima DMX

Contenuto dell'esercitazione

L'esercitazione è suddivisa nelle lezioni seguenti:

Lezione 1: Creazione della struttura di data mining Market Basket
In questa lezione verranno illustrate le procedure per l'utilizzo dell'istruzione CREATE per creare strutture di data mining.

Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Market Basket
In questa lezione verranno illustrate le procedure per l'utilizzo dell'istruzione ALTER per aggiungere modelli di data mining a una struttura di data mining.

Lezione 3: Elaborazione della struttura di data mining Market Basket
In questa lezione verranno illustrate le procedure per l'utilizzo dell'istruzione INSERT INTO per elaborare le strutture di data mining e i modelli di data mining ad esse associati.

Lezione 4: Esecuzione delle stime relative a Market Basket
In questa lezione verranno illustrate le procedure per l'utilizzo dell'istruzione PREDICTION JOIN per creare stime basate su modelli di data mining.

Requisiti

Prima di eseguire l'esercitazione, verificare che sia installato quanto segue:

  • Microsoft SQL Server

  • Microsoft SQL Server Analysis Services

  • Database AdventureWorksDW2012

Per una maggiore sicurezza, i database di esempio non vengono installati per impostazione predefinita. Per installare i database di esempio ufficiali per Microsoft SQL Server, passare a https://www.CodePlex.com/MSFTDBProdSamples o nella home page di Microsoft SQL Server Samples and Community Projects (Esempi di microsoft SQL Server e progetti della community) nella sezione Esempi di prodotti Microsoft SQL Server. Fare clic su Database, quindi sulla scheda Versioni e selezionare i database desiderati.

Nota

Quando si esaminano le esercitazioni, è consigliabile aggiungere i pulsanti Argomento successivo e Argomento precedente alla barra degli strumenti del visualizzatore di documenti.

Vedi anche

Esercitazione su DMX per Bike Buyer
Esercitazione di base sul data mining
Lezione 3: Creazione di uno scenario Market Basket (esercitazione intermedia sul data mining)