modules Machine learning dans les modules ML Studio (classic)
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Le flux de travail habituel pour l'apprentissage automatique comprend plusieurs phases :
Identification d’un problème à résoudre et mesure pour mesurer les résultats.
Recherche, nettoyage et préparation des données appropriées.
Identification des fonctionnalités et des nouvelles fonctionnalités les plus adaptées.
Création, évaluation et paramétrage des modèles.
Utilisation de modèles pour générer des prédictions, des recommandations et d’autres résultats.
Les modules de cette section fournissent des outils pour les phases finales de Machine Learning, dans lesquels vous appliquez un algorithme aux données pour effectuer l’apprentissage d’un modèle. Dans ces dernières phases, vous générez également des scores, puis vous évaluez la précision et l’utilité du modèle.
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
Liste des tâches de Machine Learning par catégorie
-
Choisissez parmi un large éventail d’algorithmes de Machine Learning personnalisables, notamment le clustering, la régression, la classificationet les modèles de détection d’anomalie .
-
Fournissez vos données au modèle configuré pour apprendre à partir de modèles et créer des statistiques qui peuvent être utilisées pour les prédictions.
-
Créez des prédictions à l’aide des modèles formés.
-
Mesurez la précision d’un modèle formé, ou Comparez plusieurs modèles.
Pour obtenir une description détaillée de ce flux de travail expérimental, consultez la procédure pas à pas relative à la solution de risque de crédit.
Prérequis
Avant de pouvoir accéder à la partie amusante de la création d’un modèle, il est généralement nécessaire d’effectuer un grand nombre de préparation. cette section fournit des liens vers les outils de Machine Learning Studio (classic) qui peuvent vous aider à nettoyer vos données, à améliorer la qualité des entrées et à éviter les erreurs d’exécution.
Exploration des données et qualité des données
Assurez-vous que vos données sont le type de données correct, la quantité appropriée et la bonne qualité pour l’algorithme que vous avez choisi. Comprenez la quantité de données que vous possédez et la manière dont elles sont distribuées. Existe-t-il des valeurs hors norme ? Comment ont-ils été générés, et qu’est-ce que cela signifie ? Existe-t-il des doublons ?
Gérer les valeurs manquantes
Des valeurs manquantes peuvent affecter vos résultats de plusieurs façons. Par exemple, presque toutes les méthodes statistiques ignorent les cas où des valeurs sont manquantes. par défaut, Machine Learning suit ces règles lorsqu’il rencontre des lignes avec des valeurs manquantes :
Si des données utilisées pour la formation d'un modèle comportent des valeurs manquantes, toutes les lignes où des valeurs sont manquantes sont ignorées.
Si les données utilisées comme entrée lorsque la notation par rapport à un modèle contient des valeurs manquantes, les valeurs manquantes sont utilisées comme entrées, mais les valeurs NULL sont propagées. Cela signifie généralement qu’une valeur null est insérée dans les résultats au lieu d’une prédiction valide.
Veillez à vérifier vos données avant d’effectuer l’apprentissage de votre modèle. Pour imputer les valeurs manquantes ou corriger vos données, utilisez ce module :
Sélectionner des fonctionnalités et réduire la dimensionnalité
Machine Learning Studio (classic) peut vous aider à passer en revue vos données pour trouver les attributs les plus utiles.
Utilisez des outils tels que l' analyse discriminante linéaire de Fisher ou la sélection de caractéristiques basée sur les filtres pour déterminer quelles colonnes de données ont la puissance la plus prédictive. Ces outils peuvent également identifier les colonnes qui doivent être supprimées en raison de la fuite de données.
Créez ou concevez des fonctionnalités à partir de données existantes. Normaliser les données ou regrouper des données dans des emplacements pour créer de nouveaux regroupements de données ou normaliser la plage de valeurs numériques avant l’analyse.
Réduisez la dimensionnalité en regroupant les valeurs catégoriques, en utilisant l' analyse du composant principalou en échantillonnant.
Exemples
Pour obtenir des exemples d’Machine Learning en action, consultez la Azure ai Gallery.
Pour obtenir des conseils et une procédure pas à pas de certaines tâches de Prepration de données typiques, consultez procédures pas à pas exécution du processus Team Data science process.