Transformation de données – Manipulation
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
cet article décrit les modules de Machine Learning Studio (classic) que vous pouvez utiliser pour la manipulation de données de base.
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Machine Learning Studio (classic) prend en charge les tâches spécifiques à Machine Learning, telles que la normalisation ou la sélection des fonctionnalités. Les modules de cette catégorie sont destinés à des tâches plus générales.
Tâches de manipulation de données
les modules de cette catégorie sont destinés à prendre en charge les tâches de gestion des données de base qui peuvent être nécessaires dans Machine Learning Studio (classic). Les tâches suivantes sont des exemples de tâches de gestion de données de base :
- Combinez deux jeux de données, soit en utilisant des jointures, soit en fusionnant des colonnes ou des lignes.
- Créer des catégories à utiliser dans le regroupement des données.
- Modifiez les en-têtes de colonne, modifiez les types de données des colonnes ou les colonnes d’indicateurs en tant que fonctionnalités ou étiquettes.
- Vérifiez les valeurs manquantes, puis remplacez-les par les valeurs appropriées.
Tâches associées
- Effectuer un échantillonnage ou diviser un jeu de données en jeux d’apprentissage et de test : utilisez les modules transformation des données-exemple et fractionner .
- Mettre à l’échelle des nombres, normaliser des données ou placer des valeurs numériques dans des emplacements : utilisez les modules transformation des données-mettre à l’échelle et réduire .
- Effectuer des calculs sur des champs de données numériques ou générer des statistiques couramment utilisées : utilisez les outils dans les fonctions statistiques.
Exemples
Pour obtenir des exemples d’utilisation de données complexes dans les expériences de Machine Learning, consultez les exemples suivants dans la Azure ai Gallery:
- Traitement et analyse des données: illustre des outils et des processus clés.
- Détection du cancer du sein: montre comment partitionner des jeux de données, puis appliquer un traitement spécial à chaque partition.
Modules de cette catégorie
La catégorie de manipulation de transformation des données comprend les modules suivants :
- Ajout de colonnes: ajoute un ensemble de colonnes d’un jeu de données à un autre.
- Ajout de lignes: ajoute un ensemble de lignes d’un jeu de données d’entrée à la fin d’un autre jeu de données.
- application SQL Transformation: exécute une requête SQLite sur les jeux de données d’entrée pour transformer les données.
- Nettoyer les données manquantes: spécifie comment gérer les valeurs manquantes dans un DataSet. Ce module remplace le épurateur de valeurs manquant, qui est déconseillé.
- Convertir en valeurs d’indicateur: convertit les valeurs catégoriques en colonnes en valeurs d’indicateur.
- Modifier les métadonnées: modifie les métadonnées associées aux colonnes d’un DataSet.
- Regrouper des valeurs catégoriques : regroupeles données de plusieurs catégories dans une nouvelle catégorie.
- Joindre des données: joint deux jeux de données.
- Supprimer les doublons: supprime les lignes en double d’un DataSet.
- Sélectionner des colonnes dans le jeu de données: sélectionne les colonnes à inclure dans un DataSet ou à exclure d’un DataSet dans une opération.
- Sélectionner les colonnes transformer: crée une transformation qui sélectionne le même sous-ensemble de colonnes que dans un jeu de données spécifié.
- SMOTE: augmente le nombre d’exemples à faible incidence dans un jeu de données à l’aide du suréchantillonnage minoritaire synthétique.