Esplorazione del modello Call Center (Esercitazione intermedia sul data mining)
Ora che è stato creato il modello esplorativo, è possibile usarlo per altre informazioni sui dati usando gli strumenti seguenti forniti in SQL Server Data Tools (SSDT).
Visualizzatore Microsoft Neural Network: questo visualizzatore è disponibile nella scheda Visualizzatore modelli di data mining di Progettazione modelli di data mining ed è progettato per consentire di sperimentare interazioni nei dati.
Visualizzatore albero del contenuto generico Microsoft: questo visualizzatore standard fornisce dettagli approfonditi sui modelli e le statistiche individuati dall'algoritmo quando ha generato il modello.
Visualizzatore Microsoft Neural Network
Il visualizzatore ha tre riquadri: Input, Output e Variabili.
Usando il riquadro Output , è possibile selezionare valori diversi per l'attributo stimabile o la variabile dipendente. Se il modello contiene più attributi stimabili, è possibile selezionare l'attributo dall'elenco Attributo di output.
Il riquadro Variabili confronta i due risultati scelti in termini di attributi di contributo o variabili. Le barre colorate rappresentano visivamente l'impatto della variabile sui risultati di destinazione. È possibile visualizzare anche punteggi di accuratezza per le variabili. I punteggi di accuratezza vengono calcolati in modo diverso a seconda del tipo di modello di data mining utilizzato, ma indica in generale il miglioramento del modello in caso di utilizzo dell'attributo per la stima.
Il riquadro Input consente di aggiungere fattori di influenza al modello per provare vari scenari di simulazione.
Utilizzo del riquadro Output
In questo modello iniziale interessa vedere come i vari fattori influiscono sul livello del servizio. A tale scopo, è possibile selezionare Service Grade nell'elenco degli attributi di output e quindi confrontare livelli di servizio diversi selezionando gli intervalli dagli elenchi a discesa per Valore 1 e Valore 2.
Per confrontare i livelli di servizio più basso e più elevato
Per Valore 1 selezionare l'intervallo con i valori più bassi. Ad esempio, l'intervallo 0-0-0,7 rappresenta la frequenza di abbandono più bassa e pertanto il migliore livello di servizio.
Nota
I valori esatti di questo intervallo possono variare a seconda di come è stato configurato il modello.
Per Valore 2 selezionare l'intervallo con i valori più alti. Ad esempio, l'intervallo con il valore >=0,12 rappresenta i tassi di abbandono più elevati e quindi il livello di servizio peggiore. In altre parole, il 12% dei clienti che ha telefonato durante questo turno ha riagganciato prima di parlare con un rappresentante.
Il contenuto del riquadro Variabili viene aggiornato per confrontare gli attributi che contribuiscono ai valori dei risultati. Nella colonna sinistra vengono pertanto elencati gli attributi associati al migliore livello di servizio, mentre nella colonna destra vengono elencati gli attributi associati al peggiore livello di servizio.
Utilizzo del riquadro Variabili
In questo modello sembra che Average Time Per Issue
sia un fattore importante. Questa variabile indica il tempo medio necessario per rispondere a una chiamata, indipendentemente dal tipo di chiamata.
Per visualizzare e copiare i punteggi di probabilità e accuratezza per un attributo
Nel riquadro Variabili posizionare il mouse sulla barra colorata nella prima riga.
Questa barra colorata mostra come contribuisce fortemente
Average Time Per Issue
al livello di servizio. La descrizione comando indica un punteggio complessivo e i punteggi di probabilità e accuratezza per ogni combinazione di una variabile e un risultato di destinazione.Nel riquadro Variabili fare clic con il pulsante destro del mouse su una barra colorata e scegliere Copia.
In un foglio di lavoro di Excel fare clic con il pulsante destro del mouse su qualsiasi cella e scegliere Incolla.
Il report verrà incollato come tabella HTML e includerà solo i punteggi per ogni barra.
In un altro foglio di lavoro di Excel fare clic con il pulsante destro del mouse su qualsiasi cella e scegliere Incolla speciale.
Il report verrà incollato in formato testo e includerà le statistiche correlate descritte nella sezione successiva.
Utilizzo del riquadro Input
Si supponga di essere interessati all'analisi dell'effetto di un particolare fattore, ad esempio il turno o il numero di operatori. È possibile selezionare una determinata variabile usando il riquadro Input e il riquadro Variabili viene aggiornato automaticamente per confrontare i due gruppi selezionati in precedenza in base alla variabile specificata.
Per verificare l'effetto sul livello di servizio modificando gli attributi di input
Nel riquadro Input selezionare Maiusc per attributo.
In Valore selezionare AM.
Il riquadro Variabili viene aggiornato per mostrare l'impatto sul modello quando lo spostamento è AM. Tutte le altre selezioni rimangono invariate: si stanno ancora confrontando i voti di servizio più bassi e più alti.
In Valore selezionare PM1.
Il riquadro Variabili viene aggiornato per mostrare l'impatto sul modello quando cambia lo spostamento.
Nel riquadro Input fare clic sulla riga vuota successiva in Attributo e selezionare Chiamate. In Valore selezionare l'intervallo che indica il maggior numero di chiamate.
All'elenco verrà aggiunta una nuova condizione di input. Il riquadro Variabili viene aggiornato per mostrare l'impatto sul modello per uno spostamento specifico quando il volume di chiamata è più alto.
Continuare a modificare i valori per Shift e Calls per trovare eventuali correlazioni interessanti tra turno, volume di chiamate e livello del servizio.
Nota
Per cancellare il riquadro Input in modo che sia possibile usare attributi diversi, fare clic su Aggiorna contenuto visualizzatore.
Interpretazione delle statistiche presenti nel visualizzatore
Tempi di attesa più lunghi rappresentano un importante criterio di stima di una frequenza di abbandono elevata, che indica un livello di servizio insufficiente. Sebbene possa sembrare una conclusione ovvia, il modello di data mining fornisce dati statistici aggiuntivi per l'interpretazione di queste tendenze.
Punteggio: valore che indica l'importanza complessiva di questa variabile per distinguere i risultati. Più elevato è il punteggio, maggiore sarà l'effetto della variabile sul risultato.
Probabilità del valore 1: percentuale che rappresenta la probabilità di questo valore per questo risultato.
Probabilità del valore 2: percentuale che rappresenta la probabilità di questo valore per questo risultato.
Accuratezza per valore 1 e accuratezza per valore 2: punteggi che rappresentano l'impatto dell'uso di questa particolare variabile per la stima dei risultati valore 1 e valore 2. Più elevato è il punteggio, migliore risulterà la variabile per la stima dei risultati.
La tabella seguente contiene alcuni valori di esempio per i principali fattori di influenza. Ad esempio, la probabilità del valore 1 è 60,6% e la probabilità del valore 2 è 8,30%, vale a dire che quando il tempo medio per problema era compreso nell'intervallo di 44-70 minuti, il 60,6% dei casi era nel turno con i voti di servizio più elevati (Valore 1) e l'8,30% dei casi era in movimento con i voti di servizio peggiori (Valore 2).
Da queste informazioni è possibile trarre alcune conclusioni. I tempi di risposta alle chiamate più brevi (intervallo 44-70) influiscono decisamente su un livello di servizio migliore (intervallo 0,00-0,07). Il punteggio (92,35) suggerisce che questa variabile è molto importante.
Tuttavia, analizzando l'elenco dei fattori di influenza, è possibile notare altri fattori con effetti più complessi e più difficili da interpretare. Ad esempio, il turno sembra influire sul servizio, ma i punteggi di accuratezza e le probabilità relative indicano che il turno non è un fattore principale.
Attributo | Valore | Favori < 0,07 | Favori >= 0,12 |
---|---|---|---|
Average Time Per Issue | 89.087 - 120.000 | Punteggio: 100 Probabilità di valore1: 4,45 % Probabilità di valore2: 51,94 % Lift for Value1: 0,19 Lift for Value2: 1,94 |
|
Average Time Per Issue | 44.000 - 70.597 | Punteggio: 92,35 Probabilità di Valore 1: 60,06% Probabilità di Valore 2: 8,30% Accuratezza per Valore 1: 2,61 Accuratezza per Valore 2: 0,31 |
Visualizzatore albero del contenuto generico Microsoft
Questo visualizzatore può essere utilizzato per visualizzare informazioni ancora più dettagliate create dall'algoritmo quando il modello viene elaborato. MicrosoftGeneric Content Tree Viewer rappresenta il modello di data mining come una serie di nodi, in cui ogni nodo rappresenta le informazioni apprese sui dati di training. Questo visualizzatore può essere utilizzato con tutti i modelli, ma il contenuto dei nodi è diverso a seconda del tipo di modello.
Per i modelli di rete neurale o i modelli di regressione logistica, il marginal statistics node
può risultare particolarmente utile. Questo nodo contiene statistiche derivate sulla distribuzione di valori nei dati. Queste informazioni possono risultare utili se si desidera ottenere un riepilogo dei dati senza dovere scrivere molte query T-SQL. Il grafico dei valori per la creazione di contenitori nell'argomento precedente deriva dal nodo delle statistiche marginali.
Per ottenere un riepilogo dei valori dei dati dal modello di data mining
In Progettazione modelli di data mining selezionare <nome> modello di data mining nella scheda Visualizzatore modelli di data mining.
Nell'elenco Visualizzatore selezionare Microsoft Generic Content Tree Viewer.
La vista del modello di data mining verrà aggiornata per visualizzare una gerarchia di nodi nel riquadro sinistro e una tabella HTML nel riquadro destro.
Nel riquadro Node Caption (Didascalia nodo) fare clic sul nodo con il nome 1000000000000000000.
Il nodo di livello più alto in qualsiasi modello è sempre il nodo radice del modello. In un modello di rete neurale o di regressione logistica il nodo immediatamente successivo è il nodo delle statistiche marginali.
Nel riquadro Dettagli nodo scorrere verso il basso fino a trovare la riga NODE_DISTRIBUTION.
Scorrere la tabella NODE_DISTRIBUTION per visualizzare la distribuzione dei valori calcolati dall'algoritmo Microsoft Neural Network.
Per utilizzare questi dati in un report, è possibile selezionare e copiare le informazioni per le righe specifiche oppure utilizzare la query DMX (Data Mining Extensions) seguente per estrarre il contenuto completo del nodo.
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
È inoltre possibile utilizzare la gerarchia di nodi e i dettagli nella tabella NODE_DISTRIBUTION per attraversare singoli percorsi della rete neurale e visualizzare statistiche del livello nascosto. Per altre informazioni, vedere Esempi di query del modello di rete neurale.
Attività successiva della lezione
Vedi anche
Contenuto del modello di data mining per i modelli di rete neurale (Analysis Services - Data mining)
Esempi di query sul modello di rete neurale
Riferimento tecnico per l'algoritmo Microsoft Neural Network
Modificare la discretizzazione di una colonna in un modello di data mining