Transformation des données-mettre à l’échelle et réduire
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
cet article décrit les modules de Machine Learning Studio (classic) qui peuvent vous aider à utiliser des données numériques. Pour Machine Learning, les tâches de données courantes incluent le découpage, compartimentage et la normalisation des valeurs numériques. D’autres modules prennent en charge la réduction de la dimensionnalité.
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Modélisation de données numériques
Les tâches telles que la normalisation, la compartimentage ou la redistribution des variables numériques constituent une partie importante de la préparation des données pour Machine Learning. Les modules de ce groupe prennent en charge les tâches de préparation des données suivantes :
- Regroupement de données dans des emplacements de différentes tailles ou distributions.
- Suppression des valeurs hors norme ou modification de leurs valeurs.
- Normalisation d’un ensemble de valeurs numériques dans une plage spécifique.
- Création d’un ensemble compact de colonnes de fonctionnalités à partir d’un jeu de données de grande dimension.
Tâches associées
- Sélectionnez les fonctionnalités pertinentes et utiles à utiliser dans la création du modèle : utilisez les modules d’analyse discriminante de la sélection des fonctionnalités ou de Fisher Linear Linear .
- sélectionnez des fonctionnalités en fonction du nombre de valeurs : utilisez l' Learning avec le module counts .
- Supprimer ou remplacer les valeurs manquantes : utilisez le module nettoyer les données manquantes .
- Remplacez les valeurs catégoriques par des valeurs numériques dérivées des calculs : utilisez le module remplacer les valeurs discrètes .
- Calcul d’une distribution de probabilité pour les colonnes discrètes ou numériques : utilisez le module évaluer la probabilité de la fonction.
- Filtrer et transformer des signaux numériques et des formes d’ondes : utilisez le module de filtre .
Liste des modules
Cette catégorie transformation des données-mettre à l’échelle et réduire comprend les modules suivants :
- Clip values: détecte les valeurs hors norme, puis découpe ou remplace leurs valeurs.
- Grouper des données dans des emplacements: place des données numériques dans des emplacements.
- Normaliser les données: redimensionne les données numériques pour contraindre les valeurs de jeu de données à une plage standard.
- Analyse des composants principaux: calcule un ensemble de fonctionnalités qui ont une dimensionnalité réduite pour une formation plus efficace.