Condividi tramite


Contenuto dei modelli di data mining per i modelli di associazione (Analysis Services - Data mining)

In questo argomento viene descritto il contenuto dei modelli di data mining specifico per i modelli che utilizzano l'algoritmo Microsoft Association Rules. Per una spiegazione della terminologia generale e statistica relativa al contenuto dei modelli di data mining applicabile a tutti i tipi di modello, vedere Contenuto del modello di data mining (Analysis Services - Data mining).

Informazioni sulla struttura di un modello di associazione

Un modello di associazione ha una struttura semplice. Ogni modello include un singolo nodo padre che rappresenta il modello e i relativi metadati. Ciascun nodo padre è associato a un elenco semplice di set di elementi e regole. I set di elementi e le regole non sono organizzati in alberi, ma sono ordinati come illustrato nel diagramma seguente, ossia con i set di elementi seguiti dalle regole.

Struttura del contenuto del modello per i modelli di associazione

Ogni set di elementi è contenuto nel proprio nodo (NODE_TYPE = 7). Il nodo include la definizione del set di elementi, il numero di case che contengono tale set di elementi e altre informazioni.

Anche ogni regola è contenuta nel proprio nodo (NODE_TYPE = 8). Una regola descrive un modello generale per la modalità di associazione degli elementi. È simile a un'istruzione IF-THEN. Il lato sinistro della regola indica una condizione o un set di condizioni esistente. Il lato destro indica l'elemento del set di dati solitamente associato alle condizioni riportate a sinistra.

Nota   Se si desidera estrarre le regole o i set di elementi, è possibile utilizzare una query che restituisca solo i tipi di nodi richiesti. Per ulteriori informazioni, vedere Esecuzione di query su un modello di associazione (Analysis Services - Data mining).

Contenuto di un modello di associazione

In questa sezione vengono forniti dettagli ed esempi relativi solo alle colonne del contenuto dei modelli di data mining pertinenti per i modelli di associazione.

Per informazioni sulle colonne generiche nel set di righe dello schema, ad esempio MODEL_CATALOG e MODEL_NAME, vedere Contenuto del modello di data mining (Analysis Services - Data mining).

  • MODEL_CATALOG
    Nome del database in cui è archiviato il modello.

  • MODEL_NAME
    Nome del modello.

  • ATTRIBUTE_NAME
    Nomi degli attributi che corrispondono a questo nodo.

  • NODE_NAME
    Nome del nodo. Per un modello di associazione, questa colonna contiene lo stesso valore di NODE_UNIQUE_NAME.

  • NODE_UNIQUE_NAME
    Nome univoco del nodo.

  • NODE_TYPE
    Un modello di associazione restituisce solo i tipi di nodo seguenti:

    ID tipo di nodo

    Tipo

    1 (Model)

    Radice o nodo padre.

    7 (Itemset)

    Set di elementi, ovvero raccolta di coppie attributo-valore. Esempi:

    Product 1 = Existing, Product 2 = Existing

    oppure

    Gender = Male.

    8 (Rule)

    Regola che definisce la modalità di correlazione tra gli elementi.

    Esempio:

    Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.

  • NODE_CAPTION
    Etichetta o didascalia associata al nodo.

    Nodo di set di elementi   Elenco di elementi delimitati da virgole.

    Nodo di regola   Contiene i lati sinistro e destro della regola.

  • CHILDREN_CARDINALITY
    Indica il numero di figli del nodo corrente.

    Nodo padre   Indica il numero complessivo di set di elementi e regole.

    Nota

    Per ottenere una suddivisione del conteggio relativo a set di elementi e regole, vedere NODE_DESCRIPTION per il nodo radice del modello.

    Nodo di set di elementi o di regola   Sempre 0.

  • PARENT_UNIQUE_NAME
    Nome univoco del nodo padre del nodo.

    Nodo padre   Sempre NULL.

    Nodo di set di elementi o di regola   Sempre 0.

  • NODE_DESCRIPTION
    Descrizione semplice del contenuto del nodo.

    Nodo padre   Include un elenco delimitato da virgole delle informazioni seguenti sul modello:

    Elemento

    Descrizione

    ITEMSET_COUNT

    Conteggio di tutti i set di elementi nel modello.

    RULE_COUNT

    Conteggio di tutte le regole nel modello.

    MIN_SUPPORT

    Supporto minimo individuato per ogni singolo set di elementi.

    Nota   Questo valore potrebbe essere diverso da quello impostato per il parametro MINIMUM _SUPPORT.

    MAX_SUPPORT

    Supporto massimo individuato per ogni singolo set di elementi.

    Nota   Questo valore potrebbe essere diverso da quello impostato per il parametro MAXIMUM_SUPPORT.

    MIN_ITEMSET_SIZE

    Dimensione del set di elementi più piccolo, rappresentata come conteggio di elementi.

    Il valore 0 indica che lo stato Missing viene considerato come un elemento indipendente.

    Nota   Il valore predefinito del parametro MINIMUM_ITEMSET_SIZE è 1.

    MAX_ITEMSET_SIZE

    Indica la dimensione del set di elementi più grande individuato.

    Nota   Questo valore è vincolato dal valore impostato per il parametro MAX_ITEMSET_SIZE durante la creazione del modello. Non può mai superare tale valore, ma può essere minore. Il valore predefinito è 3.

    MIN_PROBABILITY

    Probabilità minima individuata per ogni singolo set di elementi o regola nel modello.

    Esempio: 0,400390625

    Nota   Per i set di elementi, questo valore è sempre maggiore del valore impostato per il parametro MINIMUM_PROBABILITY durante la creazione del modello.

    MAX_PROBABILITY

    Probabilità massima individuata per ogni singolo set di elementi o regola nel modello.

    Esempio: 1

    Nota   Non esistono parametri che vincolano la probabilità massima dei set di elementi. Se si desidera eliminare gli elementi troppo frequenti, utilizzare il parametro MAXIMUM_SUPPORT.

    MIN_LIFT

    Livello minimo di accuratezza fornito dal modello per un set di elementi.

    Esempio: 0,4309369632511

    NotaNota
    Conoscendo questo valore, è possibile determinare se l'accuratezza è significativa per ogni singolo set di elementi.

    MAX_LIFT

    Livello massimo di accuratezza fornito dal modello per ogni set di elementi.

    Esempio: 1,95758227647523 Nota   Conoscendo questo valore, è possibile determinare se l'accuratezza è significativa per ogni singolo set di elementi.

    Nodo di set di elementi   I nodi di set di elementi contengono un elenco di elementi, visualizzato come stringa di testo delimitato da virgole.

    Esempio:

    Touring Tire = Existing, Water Bottle = Existing

    Significa che i pneumatici Touring e le bottiglie di acqua sono stati acquistati insieme.

    Nodo di regola   I nodi di regole contengono i lati sinistro e destro della regola, separati da una freccia.

    Esempio: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

    Significa che chi ha acquistato un pneumatico Touring e una bottiglia d'acqua è probabile che abbia anche acquistato un berretto da ciclista.

  • NODE_RULE
    Frammento XML che descrive la regola o il set di elementi incorporato nel nodo.

    Nodo padre   Vuoto.

    Nodo di set di elementi   Vuoto.

    Nodo di regola   Il frammento XML include informazioni utili aggiuntive sulla regola, ad esempio supporto, confidenza, nonché il numero di elementi e l'ID del nodo che rappresenta il lato sinistro della regola.

  • MARGINAL_RULE
    Vuoto.

  • NODE_PROBABILITY
    Probabilità o punteggio di confidenza associato al set di elementi o alla regola.

    Nodo padre   Sempre 0.

    Nodo di set di elementi   Probabilità del set di elementi.

    Nodo di regola   Valore di confidenza per la regola.

  • MARGINAL_PROBABILITY
    Uguale a NODE_PROBABILITY.

  • NODE_DISTRIBUTION
    La tabella contiene informazioni molto diverse, a seconda che il nodo sia un set di elementi o una regola.

    Nodo padre   Vuoto.

    Nodo di set di elementi   Elenca ogni elemento del set di elementi insieme a un valore di probabilità e di supporto. Se ad esempio il set di elementi contiene due prodotti, viene riportato il nome di ogni prodotto insieme al conteggio dei case che lo includono.

    Nodo di regola   Contiene due righe. Nella prima riga è indicato l'attributo del lato destro della regola, ovvero l'elemento stimato, insieme a un punteggio di confidenza.

    La seconda riga è univoca per i modelli di associazione. Contiene un puntatore al set di elementi sul lato destro della regola. Il puntatore è rappresentato nella colonna ATTRIBUTE_VALUE come ID del set di elementi che contiene solo l'elemento di destra.

    Ad esempio, se la regola è If {A,B} Then {C}, la tabella contiene il nome dell'elemento {C} e l'ID del nodo che contiene il set di elementi per l'elemento C.

    Questo puntatore è utile perché consente di determinare dal nodo di set di elementi la quantità complessiva di case che includono il prodotto del lato destro. I casi soggetti alla regola If {A,B} Then {C} sono un subset dei case elencati nel set di elementi per {C}.

  • NODE_SUPPORT
    Numero di case che supportano il nodo.

    Nodo padre   Numero di case nel modello.

    Nodo di set di elementi   Numero di case che contengono tutti gli elementi del set di elementi.

    Nodo di regola   Numero di case che contengono tutti gli elementi inclusi nella regola.

  • MSOLAP_MODEL_COLUMN
    Contiene informazioni diverse a seconda che il nodo sia un set di elementi o una regola.

    Nodo padre   Vuoto.

    Nodo di set di elementi   Vuoto.

    Nodo di regola   ID del set di elementi che contiene gli elementi nel lato sinistro della regola. Se ad esempio la regola è If {A,B} Then {C}, questa colonna contiene l'ID del set di elementi che contiene solo {A,B}.

  • MSOLAP_NODE_SCORE
    Nodo padre   Vuoto.

    Nodo di set di elementi   Punteggio della priorità per il set di elementi.

    Nodo di regola   Punteggio della priorità per la regola.

    Nota

    La priorità viene calcolata in modo diverso per i set di elementi e le regole. Per ulteriori informazioni, vedere Riferimento tecnico per l'algoritmo Microsoft Association Rules.

  • MSOLAP_NODE_SHORT_CAPTION
    Vuoto.