Personnalisation et traitement du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)
L’algorithme Microsoft Time Series fournit des paramètres qui affectent la création d’un modèle et l’analyse des données temporelles. La modification de ces propriétés peuvent affecter de manière importante la manière dont le modèle d'exploration de données élabore des prédictions.
Pour cette tâche du didacticiel, vous effectuerez les tâches suivantes pour modifier le modèle :
Vous allez personnaliser la façon dont votre modèle gère les périodes de temps en ajoutant une nouvelle valeur pour le paramètre PERIODICITY_HINT .
Vous découvrirez deux autres paramètres importants pour l'algorithme MTS : FORECAST_METHOD qui vous permet de contrôler la méthode utilisée pour les prédictions, et PREDICTION_SMOOTHING, qui vous permet de personnaliser le mélange des prédictions à long terme et à court terme.
Vous pouvez également dire à l'algorithme la manière dont vous souhaitez imputer les valeurs manquantes.
Après avoir apporté toutes les modifications, vous allez déployer et traiter le modèle.
Définition des paramètres de série chronologique
Indications de périodicité
Le paramètre PERIODICITY_HINT fournit à l’algorithme des informations sur les périodes supplémentaires que vous vous attendez à voir dans les données. Par défaut, les modèles de série chronologique essayeront de détecter automatiquement un modèle dans les données. Toutefois, si vous connaissez déjà le cycle de temps estimé, fournir un indicateur de périodicité peut potentiellement améliorer la précision du modèle. Toutefois, si vous fournissez le mauvais indicateur de périodicité, celui-ci peut diminuer la précision ; par conséquent, si vous ne savez pas précisément quelle valeur doit être utilisée, il est préférable d'utiliser la valeur par défaut.
Par exemple, la vue utilisée pour ce modèle agrège les données de ventes d’Adventure Works DW Multidimensional 2012 sur une base mensuelle. Par conséquent, chaque tranche de temps utilisée par le modèle représente un mois et toutes les prédictions se feront également en termes de mois. Étant donné qu’il y a 12 mois dans une année et que vous vous attendez à ce que les modèles de ventes se répètent plus ou moins sur une base annuelle, vous définissez le paramètre 12
PERIODICITY_HINT sur , pour indiquer que 12 tranches de temps (mois) constituent un cycle de vente complet.
Méthode de prévisions
Le paramètre FORECAST_METHOD contrôle si l’algorithme de série chronologique est optimisé pour les prédictions à court terme ou à long terme. Par défaut, le paramètre FORECAST_METHOD est défini sur MIXED, ce qui signifie que deux algorithmes différents sont fusionnés et équilibrés pour fournir de bons résultats pour la prédiction à court terme et à long terme.
Toutefois, si vous savez que vous souhaitez utiliser un algorithme particulier, vous pouvez modifier la valeur sur ARIMA ou ARTXP.
Pondération des Long-Term et des prédictions Short-Term
Vous pouvez également personnaliser la manière dont les prédictions à long terme et à court terme sont combinées à l'aide du paramètre PREDICTION_SMOOTHING. Par défaut, ce paramètre est défini sur 0,5, ce qui fournit généralement le meilleur équilibre pour une précision globale.
Pour changer les paramètres d'algorithme
Sous l’onglet Modèles d’exploration de données, cliquez avec le bouton droit sur Prévision, puis sélectionnez Définir les paramètres de l’algorithme.
Dans la
PERIODICITY_HINT
ligne de la boîte de dialogue Paramètres de l’algorithme , cliquez sur la colonne Valeur , puis tapez{12}
, y compris les accolades.Par défaut, l'algorithme ajoute également la valeur {1}.
Dans la
FORECAST_METHOD
ligne, vérifiez que la zone de texte Valeur est vide ou définie surMIXED
. Si une autre valeur a été entrée, tapezMIXED
pour rétablir la valeur par défaut du paramètre.Dans la ligne PREDICTION_SMOOTHING , vérifiez que la zone de texte Valeur est vide ou définie sur 0,5. Si une autre valeur a été entrée, cliquez sur Valeur et tapez
0.5
pour rétablir la valeur par défaut du paramètre.Notes
Le paramètre PREDICTION_SMOOTHING est disponible uniquement dans SQL Server Entreprise. Par conséquent, vous ne pouvez pas afficher ou modifier la valeur du paramètre PREDICTION_SMOOTHING dans SQL Server Standard. Toutefois, le comportement par défaut consiste à utiliser les deux algorithmes et à les pondérer de manière égale.
Cliquez sur OK.
Gestion des données manquantes (facultatif)
Dans de nombreux cas, vos données de ventes peuvent comporter des vides comblés par des valeurs NULL, ou un magasin peut ne pas avoir respecté la date limite du signalement des données, ce qui laisse une cellule vide à la fin d'une série. Dans ces scénarios, Analysis Services génère l’erreur suivante et ne traite pas le modèle.
« Erreur (exploration de données) : horodatages non synchronisés à partir <du nom> de série, du modèle d’exploration de données, <du nom> du modèle. Toutes les séries chronologiques doivent se terminer à la même marque de temps et ne peuvent pas comporter des points de données arbitrairement absents. L'attribution de la valeur Previous ou de la valeur d'une constante numérique au paramètre MISSING_VALUE_SUBSTITUTION fournit automatiquement les points de données absents lorsque cela est possible. »
Pour éviter cette erreur, vous pouvez spécifier qu’Analysis Services fournit automatiquement de nouvelles valeurs pour combler les lacunes à l’aide de l’une des méthodes suivantes :
Utilisation d'une valeur moyenne. La moyenne est calculée à l'aide de toutes les valeurs valides comprises dans la même série de données.
Utilisation de la valeur précédente. Vous pouvez substituer des valeurs précédentes à plusieurs cellules manquantes, mais vous ne pouvez pas remplir les valeurs de début.
Utilisation d'une valeur constante que vous fournissez.
Pour spécifier le remplissage des vides par des valeurs moyennes
Sous l’onglet Modèles d’exploration de données, cliquez avec le bouton droit sur la colonne Prévision , puis sélectionnez Définir les paramètres de l’algorithme.
Dans la boîte de dialogue Paramètres de l’algorithme , dans la ligne MISSING_VALUE_SUBSTITUTION , cliquez sur la colonne Valeur , puis tapez
Mean
.
Générer le modèle
Pour utiliser le modèle, vous devez le déployer sur un serveur et traiter le modèle en exécutant les données d'apprentissage par l'algorithme.
Pour traiter le modèle de prévision
Dans le menu Modèle d’exploration de données de SQL Server Data Tools, sélectionnez Structure d’exploration de données de processus et Tous les modèles.
À l’avertissement vous demandant si vous souhaitez générer et déployer le projet, cliquez sur Oui.
Dans la boîte de dialogue Structure d’exploration de données de processus - Prévision, cliquez sur Exécuter.
La boîte de dialogue État d'avancement du traitement s'affiche et présente les informations relatives au traitement du modèle. Le traitement du modèle peut nécessiter quelques minutes.
Une fois le traitement terminé, cliquez sur Fermer pour quitter la boîte de dialogue État d'avancement du traitement .
Cliquez à nouveau sur Fermer pour quitter la boîte de dialogue Structure d’exploration de données de processus - Prévision .
Tâche suivante de la leçon
Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)
Voir aussi
Informations techniques de référence sur l’algorithme MTS (Microsoft Time Series)
Algorithme MTS (Microsoft Time Series)
Exigences et considérations concernant le traitement (exploration de données)