ALTER MINING STRUCTURE (DMX)
S’applique à SQL Server Analysis Services
Crée un modèle d'exploration de données sur la base d'une structure d'exploration de données existante. Lorsque vous utilisez l’instruction ALTER MINING STRUCTURE pour créer un modèle d’exploration de données, la structure doit déjà exister. En revanche, lorsque vous utilisez l’instruction CREATE MINING MODEL (DMX), vous créez un modèle et générez automatiquement sa structure d’exploration de données sous-jacente en même temps.
Syntaxe
ALTER MINING STRUCTURE <structure>
ADD MINING MODEL <model>
(
<column definition list>
[(<nested column definition list>) [WITH FILTER (<nested filter criteria>)]]
)
USING <algorithm> [(<parameter list>)]
[WITH DRILLTHROUGH]
[,FILTER(<filter criteria>)]
Arguments
structure
Nom de la structure d'exploration de données à laquelle le modèle d'exploration de données sera ajouté.
modèle
Nom unique du modèle d'exploration de données.
liste de définitions de colonne
Liste des définitions de colonnes séparées par des virgules.
liste de définitions de colonne imbriquée
Liste séparée par des virgules de colonnes d'une table imbriquée (le cas échéant).
Critères de filtre imbriqués
Expression de filtre appliquée aux colonnes dans une table imbriquée.
algorithm
Nom d'un algorithme d'exploration de données, tel que défini par le fournisseur.
Remarque
Une liste des algorithmes pris en charge par le fournisseur actuel peut être récupérée à l’aide de DMSCHEMA_MINING_SERVICES Ensemble de lignes. Pour afficher les algorithmes pris en charge dans l’instance actuelle d’Analysis Services, consultez Propriétés d’exploration de données.
liste de paramètres
facultatif. Liste séparée par des virgules des paramètres définis par le fournisseur de l'algorithme.
critères de filtre
Expression de filtre appliquée aux colonnes dans la table de cas.
Notes
Si la structure d'exploration de données contient des clés composites, le modèle d'exploration de données doit comporter toutes les colonnes clés définies dans la structure.
Si le modèle ne nécessite pas de colonne prédictible, par exemple, les modèles générés à l’aide des algorithmes Microsoft Clustering et Microsoft Sequence Clustering, vous n’avez pas besoin d’inclure une définition de colonne dans l’instruction. Tous les attributs figurant dans le modèle obtenu seront considérés comme des entrées.
Dans la clause WITH qui s’applique à la table de cas, vous pouvez spécifier des options pour le filtrage et l’extraction :
Ajoutez le mot clé FILTER et une condition de filtre. Le filtre s'applique aux cas dans le modèle d'exploration de données.
Ajoutez le mot clé DRILLTHROUGH pour permettre aux utilisateurs du modèle d’exploration de données d’explorer les résultats du modèle vers les données de cas. Dans les extensions DMX (Data Mining Extensions), l'extraction ne peut être activée que lors de la création du modèle.
Pour utiliser le filtrage de cas et l’extraction, vous combinez les mots clés dans une seule clause WITH à l’aide de la syntaxe indiquée dans l’exemple suivant :
WITH DRILLTHROUGH, FILTER(Gender = 'Male')
Liste des définitions de colonnes
Vous définissez la structure d'un modèle en spécifiant une liste de définitions de colonnes qui comprend les informations suivantes pour chaque colonne :
Nom (obligatoire)
Alias (facultatif)
Indicateurs de modélisation
Requête de prédiction, qui indique à l’algorithme si la colonne contient une valeur prévisible, indiquée par la clause PREDICT ou PREDICT_ONLY
Utilisez la syntaxe suivante pour la liste de définitions de colonnes pour définir une seule colonne :
<structure column name> [AS <model column name>] [<modeling flags>] [<prediction>]
Nom de colonne et alias
Le nom de colonne que vous utilisez dans la liste de définitions de colonnes doit être identique à celui utilisé dans la structure d'exploration de données. Toutefois, vous pouvez éventuellement définir un alias pour représenter la colonne de structure dans le modèle d'exploration de données. Vous pouvez également créer plusieurs définitions de colonne pour la même colonne de structure et attribuer un alias et une utilisation de prédiction différents à chaque copie de la colonne. Par défaut, le nom de la colonne de structure est utilisé si vous ne définissez pas d'alias. Pour plus d’informations, consultez Créer un alias pour une colonne de modèle.
Pour les colonnes de table imbriquées, vous spécifiez le nom de la table imbriquée, spécifiez le type de données en tant que TABLE, puis fournissez la liste des colonnes imbriquées à inclure dans le modèle, entre parenthèses.
Vous pouvez définir une expression de filtre appliquée à la table imbriquée en apposant une expression de critères de filtre après la définition de la colonne de table imbriquée.
Indicateurs de modélisation
Analysis Services prend en charge les indicateurs de modélisation suivants pour une utilisation dans les colonnes de modèle d’exploration de données :
Remarque
L'indicateur de modélisation NOT_NULL s'applique à la colonne de structure d'exploration de données. Pour plus d’informations, consultez CREATE MINING STRUCTURE (DMX).
Terme | Définition |
---|---|
REGRESSOR | Indique que l'algorithme peut utiliser la colonne spécifiée dans la formule de régression des algorithmes de régression. |
MODEL_EXISTENCE_ONLY | Indique que les valeurs de la colonne d'attribut sont moins importantes que la présence de l'attribut. |
Vous pouvez définir plusieurs indicateurs de modélisation pour une colonne. Pour plus d’informations sur l’utilisation des indicateurs de modélisation, consultez DMX (Modeling Flags).
Clause de prédiction
La clause de prédiction décrit de quelle manière la colonne de prédiction est utilisée. Le tableau suivant répertorie les clauses possibles.
Clause | Description |
---|---|
PREDICT | Cette colonne peut être prédite par le modèle, et ses valeurs peuvent être utilisées comme entrée pour prédire la valeur d'autres colonnes prédictibles. |
PREDICT_ONLY | Cette colonne peut être prédite par le modèle, mais ses valeurs ne peuvent pas être utilisées dans des cas d'entrée pour prédire la valeur d'autres colonnes prédictibles. |
Expressions de critères de filtre
Vous pouvez définir un filtre qui restreint les cas utilisés dans le modèle d'exploration de données. Le filtre peut être appliqué aux colonnes dans la table de cas ou aux lignes dans la table imbriquée, ou bien aux deux à la fois.
Les expressions de critères de filtre sont des prédicats DMX simplifiées, semblables à une clause WHERE. Les expressions de filtre se limitent à des formules qui utilisent des opérateurs mathématiques de base, des scalaires et des noms de colonne. L'opérateur EXISTS fait figure d'exception, car il prend la valeur True si au moins une ligne est retournée pour la sous-requête. Les prédicats peuvent être combinés en utilisant les opérateurs logiques communs AND, OR et NOT.
Pour plus d’informations sur les filtres utilisés avec les modèles d’exploration de données, consultez Filtres pour les modèles d’exploration de données (Analysis Services - Exploration de données).
Remarque
Les colonnes dans un filtre doivent être des colonnes de structure d'exploration de données. Vous ne pouvez pas créer de filtre sur une colonne de modèle ou une colonne en tant qu'alias.
Pour plus d’informations sur les opérateurs et la syntaxe DMX, consultez Colonnes du modèle d’exploration de données.
Liste des définitions des paramètres
Vous pouvez ajuster les performances et la fonctionnalité d'un modèle en ajoutant des paramètres d'algorithme à la liste des paramètres. Les paramètres que vous pouvez utiliser dépendent de l'algorithme que vous spécifiez dans la clause USING. Pour obtenir la liste des paramètres associés à chaque algorithme, consultez Algorithmes d’exploration de données (Analysis Services - Exploration de données).
La syntaxe de la liste des paramètres est la suivante :
[<parameter> = <value>, <parameter> = <value>,...]
Exemple 1 : ajouter un modèle à une structure
L’exemple suivant ajoute un modèle d’exploration de données Naive Bayes à la structure d’exploration de données New Mailing et limite le nombre maximal d’états d’attributs à 50.
ALTER MINING STRUCTURE [New Mailing]
ADD MINING MODEL [Naive Bayes]
(
CustomerKey,
Gender,
[Number Cars Owned],
[Bike Buyer] PREDICT
)
USING Microsoft_Naive_Bayes (MAXIMUM_STATES = 50)
Exemple 2 : ajouter un modèle filtré à une structure
L’exemple suivant ajoute un modèle d’exploration de données, Naive Bayes Women
à la structure d’exploration de données New Mailing . Le nouveau modèle a la même structure de base que le modèle d'exploration de données ajouté dans l'exemple 1, à la différence près que ce modèle restreint les cas de la structure d'exploration de données aux clients qui sont des femmes de plus de 50 ans.
ALTER MINING STRUCTURE [New Mailing]
ADD MINING MODEL [Naive Bayes Women]
(
CustomerKey,
Gender,
[Number Cars Owned],
[Bike Buyer] PREDICT
)
USING Microsoft_Naive_Bayes
WITH FILTER([Gender] = 'F' AND [Age] >50)
Exemple 3 : ajouter un modèle filtré à une structure avec une table imbriquée
L'exemple suivant ajoute un modèle d'exploration de données à une version modifiée de la structure d'exploration de données du panier d'achat. La structure d’exploration de données utilisée dans l’exemple a été modifiée pour ajouter une colonne Région , qui contient des attributs pour la région client et une colonne Groupe de revenus, qui catégorise les revenus des clients à l’aide des valeurs High, Moderate ou Low.
La structure d'exploration de données inclut également une table imbriquée qui répertorie les articles que le client a achetés.
Étant donné que la structure d'exploration de données contient une table imbriquée, vous pouvez définir un filtre sur la table de cas, la table imbriquée ou les deux. Cet exemple combine un filtre de cas et un filtre de lignes imbriqué pour restreindre les cas aux clients européens fortunés qui ont acheté l'un des modèles de pneu route.
ALTER MINING STRUCTURE [Market Basket with Region and Income]
ADD MINING MODEL [Decision Trees]
(
CustomerKey,
Region,
[Income Group],
[Product] PREDICT (Model)
WITH FILTER (EXISTS (SELECT * FROM [v Assoc Seq Line Items] WHERE
[Model] = 'HL Road Tire' OR
[Model] = 'LL Road Tire' OR
[Model] = 'ML Road Tire' )
)
) WITH FILTER ([Income Group] = 'High' AND [Region] = 'Europe')
USING Microsoft_Decision Trees
Voir aussi
Instructions de définition de données DMX (Data Mining Extensions)
Instructions de manipulation de données DMX (Data Mining Extensions)
Guide de référence des instructions DMX (Data Mining Extensions)