Transformation des données - Filtre
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Cet article explique comment utiliser les modules de filtre dans Machine Learning Studio (classique) pour transformer des données numériques. Les modules de ce groupe d’outils pour Machine Learning Studio (classique) sont basés sur des filtres développés pour la technologie de traitement de signal numérique.
Notes
S’applique à : Machine Learning Studio (classique) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Les filtres sont généralement appliqués aux données à l’étape de traitement des données ou à l’étape de prétraitement. Les filtres renforcent la clarté du signal utilisé pour le Machine Learning. Par exemple, vous pouvez utiliser les modules de filtre dans Machine Learning Studio (classique) pour ces tâches de traitement :
- Nettoyez les formes d’onde utilisées pour la reconnaissance vocale.
- déceler des tendances ou supprimer des effets saisonniers dans des données commerciales ou économiques brouillées.
- Analysez les modèles ou les artefacts dans les signaux de télémétrie.
Ces modules fournissent une configuration facile des filtres à l’aide d’algorithmes bien recherchés pour transformer mathématiquement les données de forme d’onde. Vous pouvez également créer un filtre personnalisé si vous avez déjà déterminé les coefficients appropriés à appliquer à vos données.
Tâches associées
Si vous devez effectuer des tâches telles que l’exclusion des données d’un jeu de données sur une base de lignes par ligne, la suppression de valeurs manquantes ou la réduction de la taille d’un jeu de données, utilisez ces modules à la place :
- Nettoyer les données manquantes : supprimez les valeurs manquantes ou remplacez les valeurs manquantes par des espaces réservés.
- Partition et exemple : Divisez ou filtrez votre jeu de données à l’aide de critères tels qu’une plage de dates, une valeur spécifique ou des expressions régulières.
- Valeurs de clip : Définissez une plage de valeurs et conservez uniquement les valeurs au sein de cette plage.
Filtres dans le traitement des signaux numériques
Tout comme vous pouvez attacher un filtre à une caméra pour compenser l’éclairage ou créer des effets spéciaux, vous pouvez appliquer un filtre aux données que vous utilisez pour le Machine Learning. Les filtres peuvent améliorer la clarté d’un signal, capturer des caractéristiques intéressantes ou réduire le bruit.
Le filtre idéal éliminerait tout le bruit et aurait une sensibilité uniforme pour le signal souhaité. Toutefois, la conception d’un filtre assez bon peut prendre de nombreuses itérations ou combinaisons de techniques. Si vous réussissez à concevoir un filtre efficace, envisagez d’enregistrer le filtre afin de pouvoir le réutiliser lorsque vous transformez de nouvelles données.
En général, le filtrage est basé sur les principes de l'analyse du signal. Lorsque vous concevez un filtre, vous recherchez des façons de supprimer ou d’amplifier des parties du signal, d’exposer des tendances sous-jacentes, de réduire le bruit et les interférences, ou d’identifier les valeurs de données qui, sinon, ne peuvent pas être perçues.
Diverses techniques sont appliquées pour décomposer les tendances individuelles ou les composants de forme d’onde qui créent des valeurs de données réelles. La série de valeurs peut être analysée à l’aide de fonctions trigonométriques pour identifier et isoler les formes d’onde individuelles. (Il s’agit d’une série econométrique ou des fréquences composites de signaux audio.) Les filtres peuvent ensuite être appliqués à ces formes d’ondes pour éliminer le bruit, amplifier certaines ondes ou supprimer des composants ciblés.
Quand le filtrage est appliqué à une série brouillée pour isoler les différents composants, vous pouvez spécifier les fréquences à supprimer ou renforcer, en spécifiant la bande de fréquences à utiliser.
Filtres numériques dans Machine Learning Studio (classique)
Les types de filtres suivants sont pris en charge dans Machine Learning Studio (classique) :
- Filtres basés sur la décomposition de forme d’onde. Les exemples incluent des filtres de réponse d’impulsion finie (FIR) et de réponse d’impulsion infinie (IIR). Ces filtres fonctionnent en supprimant des composants spécifiques d’une série globale. Vous pouvez ensuite afficher et examiner la forme d’onde simplifiée.
- Filtres basés sur les moyennes mobiles ou les valeurs médianes. Ces filtres lissent les variations dans une série de données en faisant la moyenne entre des fenêtres de temps. Les fenêtres peuvent être fixes ou glissantes et peuvent avoir différentes formes. Par exemple, une fenêtre triangulaire forme un pic au point de données en cours (pèse plus fort sur la valeur actuelle) et diminue avant et après le point de données (pèse moins fort sur les valeurs précédente et suivante).
- Filtres définis par l'utilisateur ou personnalisés. Si vous connaissez déjà les transformations qui doivent être appliquées à une série de données, vous pouvez créer un filtre défini par l’utilisateur. Vous fournissez les coefficients numériques appliqués pour transformer la série de données. Un filtre personnalisé peut émuler un filtre FIR ou IIR. Toutefois, avec un filtre personnalisé, vous avez plus de contrôle sur les valeurs à appliquer à chaque point de la série.
Filtrer la terminologie
La liste suivante inclut des définitions simples des termes utilisés dans les paramètres et les propriétés des filtres :
- Passband : plage de fréquences pouvant passer par un filtre sans être atténuée ou affaiblie.
- Bande d’arrêt : plage de fréquences entre les limites spécifiées à travers lesquelles les signaux ne sont pas passés. Vous définissez la bande affaiblie en définissant les fréquences de coupure.
- Passez haut : Laissez uniquement les fréquences élevées à travers.
- Passe faible : acceptez uniquement les fréquences inférieures à une valeur de coupure spécifiée.
- Angle : définit la limite entre les fréquences de bande d’arrêt et de bande directe. En général, vous pouvez décider si le coude est inclus ou exclu de la bande. Un filtre de premier ordre provoque une atténuation progressive jusqu’à la fréquence d’angle. Après cela, le filtre provoque une atténuation exponentielle. Les filtres de commande plus élevés (tels que les filtres Butterworth et Chebyshev) ont des pentes plus raides après la fréquence d’angle. Les filtres de commande plus élevés atténuent les valeurs du stopband beaucoup plus rapidement et entièrement.
- Filtre bandtop (également appelé filtre de rejet de bande ou filtre de notch ) : n’a qu’un seul stopband. Vous définissez le stopband en spécifiant deux fréquences : la fréquence de coupure élevée et la fréquence de coupure basse. Un filtre bandpass comporte généralement deux bandes d’arrêt : un côté du composant souhaité.
- Ondulation : une petite variation indésirable qui se produit régulièrement. Dans Machine Learning, vous pouvez spécifier la quantité d’ondulation à tolérer dans le cadre des paramètres de la conception de filtre IIR.
Conseil
Vous avez besoin de plus d’informations ? Si vous débutez avec le traitement du signal numérique, consultez Une présentation du traitement de signal numérique. Le site web fournit des définitions et des aides visuelles utiles qui expliquent la terminologie et les concepts de base.
Liste des modules
Les modules suivants sont inclus dans la catégorie Transformation de données - Filtre :
- Appliquer un filtre : applique un filtre aux colonnes spécifiées d’un jeu de données.
- Filtre FIR : crée un filtre FIR pour le traitement des signaux.
- Filtre IIR : crée un filtre IIR pour le traitement des signaux.
- Filtre médian : crée un filtre médian utilisé pour l’analyse des tendances.
- Filtre de moyenne mobile : crée un filtre de moyenne mobile qui lisse les données pour l’analyse des tendances.
- Filtre de seuil : crée un filtre de seuil qui limite les valeurs.
- Filtre défini par l’utilisateur : crée un filtre FIR ou IIR personnalisé.