Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Lorsque vous préparez des données afin de les utiliser dans un modèle de prévision, vous devez veiller à ce qu'elles contiennent une colonne pouvant être utilisée pour identifier les étapes dans la série chronologique. Cette colonne sera désignée comme colonne Key Time
. Puisqu'il s'agit d'une clé, la colonne doit contenir des valeurs numériques uniques.
Le choix de la bonne unité pour la colonne Key Time
est une partie importante de l'analyse. Par exemple, supposons que vos données de ventes soient actualisées minute par minute. Vous n'êtes pas obligé de prendre les minutes comme unité pour la série chronologique ; il peut être plus explicite de regrouper les chiffres des ventes par jour, semaine ou même par mois. Si vous ne savez pas quelle unité de temps utiliser, vous pouvez créer une vue de source de données pour chaque agrégation et générer les modèles associés, pour savoir si différentes tendances émergent à chaque niveau d'agrégation.
Pour ce didacticiel, les données de ventes sont collectées quotidiennement dans la base de données des ventes transactionnelles, mais pour l'exploration de données, les données ont été préagrégées par mois, à l'aide d'une vue.
De plus, il est souhaitable pour l'analyse que les données aient aussi peu d'écart possible. Si vous envisagez d'analyser plusieurs séries de données, toutes les séries devraient commencer et se terminer de préférence aux mêmes dates. Si les données présentent des lacunes, mais qu’elles ne se trouvent pas au début ou à la fin d’une série, vous pouvez utiliser le paramètre MISSING_VALUE_SUBSTITUTION pour remplir la série. Analysis Services fournit également plusieurs options pour remplacer les données manquantes par des valeurs, telles que l’utilisation de moyennes ou de constantes.
Avertissement
Les outils de graphique croisé dynamique et de tableau croisé dynamique qui ont été inclus dans les versions antérieures du concepteur de vue de source de données ne sont plus fournis. Nous vous recommandons d’identifier les lacunes dans les données de série chronologique au préalable, à l’aide d’outils tels que le profileur de données inclus dans Integration Services.
Pour identifier la clé de temps pour le modèle de prévision
Dans le volet SalesByRegion.dsv [Design], cliquez avec le bouton droit sur la table vTimeSeries, puis sélectionnez Explorer les données.
Un nouvel onglet s’ouvre, intitulé Explorer la table vTimeSeries.
Sous l’onglet Table , passez en revue les données utilisées dans les colonnes TimeIndex et Date de rapport.
Ces deux sont des séquences comportant des valeurs uniques et peuvent être toutes deux utilisées comme clé de série chronologique ; toutefois, les types de données des colonnes sont différents. L'algorithme MTS (Microsoft Time Series) ne requiert pas de type de données
datetime
, mais uniquement que les valeurs soient distinctes et classées. Par conséquent, l'une ou l'autre des colonnes peuvent être utilisées comme clé de temps pour le modèle de prévision.Dans l’aire de conception de la vue de source de données, sélectionnez la colonne Date du rapport, puis sélectionnez Propriétés. Cliquez ensuite sur la colonne TimeIndex et sélectionnez Propriétés.
Le champ TimeIndex a le type de données System.Int32, tandis que le champ Reporting Date a le type de données System.DateTime. De nombreux entrepôts de données convertissent les valeurs date/heure en entiers et utilisent la colonne des entiers comme clé pour améliorer les performances d'indexation. Toutefois, si vous utilisez cette colonne, l'algorithme MTS établit des prédictions à l'aide de valeurs futures, telles que 201014, 201014, etc. Étant donné que vous souhaitez représenter vos prévisions de données de ventes à l’aide de dates de calendrier, vous utiliserez la colonne Date de rapport comme identificateur de série unique.
Pour définir la clé dans la vue de source de données
Dans le volet SalesByRegion.dsv, sélectionnez la table vTimeSeries.
Cliquez avec le bouton droit sur la colonne Date du rapport, puis sélectionnez Définir la clé primaire logique.
Gestion des données manquantes (facultatif)
S'il manque des données dans une série, vous risquez d'obtenir une erreur lorsque vous essayez de traiter le modèle. Il existe plusieurs manières de gérer les données manquantes :
Vous pouvez laisser Analysis Services remplir les valeurs manquantes, en calculant une moyenne ou en utilisant une valeur précédente. Pour ce faire, définissez le paramètre MISSING_VALUE_SUBSTITUTION sur le modèle d'exploration de données. Pour plus d’informations sur ce paramètre, consultez Informations de référence techniques sur l’algorithme Microsoft Time Series. Pour plus d’informations sur la modification des paramètres sur un modèle d’exploration de données existant, consultez Afficher ou modifier les paramètres d’algorithme.
Vous pouvez modifier la source de données ou filtrer la vue sous-jacente pour éliminer la série irrégulière ou remplacer des valeurs. Pour ce faire, vous devez utiliser la source de données relationnelle ou modifier la vue de source de données en créant des requêtes ou des calculs nommés personnalisés. Pour plus d’informations, consultez Vues de sources de données dans les modèles multidimensionnels. Une tâche ultérieure au cours de cette leçon fournit un exemple de la manière de générer à la fois une requête nommée et un calcul personnalisé.
Pour ce scénario, certaines données manquent au début d'une série : autrement dit, il n'y a pas de données pour la gamme de produits T1000 jusqu'en juillet 2007. Sinon, toutes les séries se terminent à la même date et aucune valeur ne manque.
L’algorithme Microsoft Time Series exige que toutes les séries que vous incluez dans un modèle unique aient le même point de terminaison . Étant donné que le modèle de vélo T1000 a été introduit en 2007, les données de cette série démarrent plus tard que pour les autres modèles de vélos, mais la série se termine à la même date ; les données peuvent donc être utilisées.
Pour fermer le concepteur de vues de source de données
- Cliquez avec le bouton droit sur l’onglet Explorer la table vTimeSeries, puis sélectionnez Fermer.