Ajout d'un modèle de prévision agrégée (Didacticiel intermédiaire sur l'exploration de données)
Le modèle de prévision vous a appris que même si les ventes dans la plupart des régions suivent une tendance, certaines régions et certains modèles, tels que le modèle M200 dans la région Pacific, présentent des tendances très différentes. Les différences entre les régions sont courantes et sont causées par de nombreux facteurs, notamment les promotions marketing, la création de rapports inexacts ou des événements géopolitiques.
Pour réduire la portée de ces facteurs sur les projections, vous décidez de générer un modèle d'exploration de données généralisé basé sur les mesures agrégées des ventes internationales. Vous pouvez faire ensuite des prédictions avec ce modèle et les appliquer individuellement aux régions. Enfin, vous allez comparer les prédictions créées par les différents produits.
Création des données pour le modèle général
La première étape de création du modèle généralisé consiste à agréger les chiffres des ventes internationales. Pour cela, créez une vue de source de données spéciale qui utilise une source de données existante mais effectue des calculs tels que les sommes ou les moyennes.
Pour créer une vue de source de données à l'aide d'un calcul ou d'une requête personnalisée
Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Vues des sources de données et choisissez Nouvelle vue de source de données.
Dans la page Bienvenue de l'Assistant, cliquez sur Suivant.
Dans la page Sélectionner une source de données, sélectionnez Adventure Works DW2008, puis cliquez sur Suivant.
Dans la page Sélectionner des tables et des vues, cliquez sur Suivant.
Dans la page Fin de l'Assistant, tapez le nom AllRegions, puis cliquez sur Terminer.
Ensuite, cliquez avec le bouton droit sur l'aire de conception Vue de source de données vierge et sélectionnez Nouvelle requête nommée.
Dans la boîte de dialogue Créer une requête nommée, pour Nom, tapez AllRegions, et pour Description, tapez Somme et moyenne des ventes pour tous les modèles et régions.
Dans le volet de texte SQL, tapez l'instruction suivante :
SELECT ReportingDate, SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty, SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
Cliquez sur OK.
Cliquez avec le bouton droit sur la table AllRegions et sélectionnez Explorer les données.
La nouvelle vue de source de données contient à la fois une somme et une moyenne pour les ventes de tous les produits à l'international. Vous pouvez regrouper et agréger également les ventes par modèle, mais dans le cadre de ce didacticiel vous allez créer un modèle de série chronologique unique que vous pouvez utiliser pour la prédiction avec n'importe quelle combinaison de région ou de produit.
Après avoir créé la nouvelle vue des données, vous devez générer une nouvelle structure d'exploration de données puis créer un modèle d'exploration de données basé sur cette structure. À ce stade, vous êtes supposé savoir comment générer une structure d'exploration de données. Par conséquent, les instructions suivantes sont simplifiées.
Pour générer une structure d'exploration de données et un modèle d'exploration de données à l'aide des données agrégées
Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Structures d'exploration de données et sélectionnez Nouvelle structure d'exploration de données pour démarrer l'Assistant Exploration de données.
Dans l'Assistant Exploration de données, effectuez les sélections suivantes :
Algorithme : algorithme MTS (Microsoft Time Series)
Vue de source de données : AllRegions
Clé : ReportingDate (Key Time)and Region (Key)
Input et Predict : AvgAmt, AvgQty, SumAmt, SumQty
Nom de structure d'exploration de données : Toutes les régions
Nom de modèle d'exploration de données : Toutes les régions
Traitez la structure et le modèle.
Affichage des résultats
Avant de décider du modèle à appliquer comme modèle général pour faire des projections internationales, vous devez mieux comprendre les prédictions. Lorsque vous considérez les prédictions et les modèles d'exploration de données pour les diverses séries agrégées dans la Visionneuse de l'algorithme MTS (Microsoft Time Series), plusieurs questions viennent à l'esprit :
Jusqu'à juin 2002, chacune des lignes de tendance suit quasiment le même modèle. Après cette date, les lignes pour la quantité et le montant divergent. Qu'est-ce qui a provoqué ce changement ?
En juillet 2004, les lignes divergent à nouveau. Que s'est-il passé ?
N'oubliez pas que les prédictions pour la série M200 North America étaient beaucoup plus élevées que pour les autres produits et régions. Vous vous interrogez sur l'exactitude de ces projections et sur le fait que l'intégration de cette série peut affecter le modèle général que vous avez créé.
Dans la tâche suivante, vous allez comparer les lignes de tendance et les prédictions pour les modèles de série individuels avec le modèle basé sur des données agrégées et vous déterminerez comment les données sous-jacentes affectent le modèle.
Si vous estimez que le modèle est correct et que vous n'avez pas besoin de mieux comprendre les résultats, vous pouvez passer à la tâche Prédiction à l'aide du modèle Prévision moyenne (Didacticiel intermédiaire sur l'exploration de données).
Tâche suivante de la leçon