Machine Learning-Train
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
cet article décrit les modules fournis dans Machine Learning Studio (classic) pour l’apprentissage d’un modèle de Machine Learning. La formation est le processus d’analyse des données d’entrée à l’aide des paramètres d’un modèle prédéfini. À partir de cette analyse, le modèle apprend les modèles et les enregistre sous la forme d’un modèle formé.
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
cet article décrit également le processus global dans Machine Learning Studio (classic) pour la création de modèles, la formation, l’évaluation et le score.
Créer et utiliser des modèles de Machine Learning
Le flux de travail classique pour Machine Learning comprend les phases suivantes :
- Choix d’un algorithme approprié et définition des options initiales.
- Apprentissage du modèle sur les données compatibles.
- Création de prédictions à l’aide de nouvelles données, en fonction des modèles du modèle.
- Évaluation du modèle pour déterminer si les prédictions sont exactes, le nombre d’erreurs, et s’il existe un surajustement.
Machine Learning Studio (classic) prend en charge un framework flexible et personnalisable pour les Machine Learning. Chaque tâche de ce processus est effectuée par un type spécifique de module, qui peut être modifié, ajouté ou supprimé, sans interrompre le reste de votre expérience.
Les modules de cette catégorie prennent en charge la formation pour différents types de modèles. Pendant l’apprentissage, les données sont analysées par l’algorithme Machine Learning. Cet algorithme analyse la distribution et le type des données, compile les statistiques et crée des modèles qui peuvent être utilisés ultérieurement pour la prédiction.
En savoir plus sur l’apprentissage du modèle
lorsque Machine Learning est l’apprentissage d’un modèle, les lignes avec des valeurs manquantes sont ignorées. Par conséquent, si vous souhaitez corriger les valeurs manuellement, utiliser l’imputation ou spécifier une autre méthode pour gérer les valeurs manquantes, utilisez le module nettoyer les données manquantes avant la formation sur le jeu de données.
Nous vous recommandons d’utiliser le module modifier les métadonnées pour résoudre les autres problèmes liés aux données. Vous devrez peut-être marquer la colonne d’étiquette, changer les types de données ou corriger les noms de colonnes.
Pour d’autres tâches de nettoyage de données courantes, telles que la normalisation, l’échantillonnage, la compartimentage et la mise à l’échelle, consultez la catégorie transformation de données .
Choisir le bon formateur
La méthode que vous utilisez pour effectuer l’apprentissage d’un modèle dépend du type de modèle que vous créez et du type de données requis par le modèle. par exemple, Machine Learning fournit des modules spécifiquement pour l’apprentissage de modèles de détection d’anomalies, de modèles de recommandation et bien plus encore.
Vérifiez la liste des modules de formation pour déterminer celui qui convient à votre scénario.
Si vous n’êtes pas sûr des meilleurs paramètres à utiliser lors de l’apprentissage d’un modèle, utilisez l’un des modules fournis pour le balayage et la validation des paramètres :
Régler les hyperparamètres de modèle peut effectuer un balayage de paramètre sur presque tous les modèles de classification et de régression. Il apprend plusieurs modèles, puis retourne le meilleur modèle.
Le module de clustering de balayage prend en charge le paramétrage du modèle pendant le processus d’apprentissage et est destiné à être utilisé uniquement avec les modèles de clustering. Vous pouvez spécifier une plage de centroïdes et effectuer l’apprentissage sur des données tout en détectant automatiquement les meilleurs paramètres.
Le module Cross-Validate Model est également utile pour l’optimisation du modèle, mais ne retourne pas de modèle formé. Au lieu de cela, il fournit des mesures que vous pouvez utiliser pour déterminer le meilleur modèle.
Reformer des modèles
Si vous avez besoin de reformer un modèle de production, vous pouvez réexécuter l’expérience à tout moment.
Vous pouvez également automatiser le processus de reformation à l’aide des services Web. pour obtenir une procédure pas à pas, consultez reformation et mise à jour des modèles de Machine Learning avec Azure Data Factory.
Utiliser des modèles préformés
Machine Learning comprend des modèles préformés, tels que le module de Classification d’images en Cascade préformé . Vous pouvez utiliser ces modèles pour la notation sans entrée de données supplémentaire.
En outre, certains modules (tels que la détection d’anomalies de série chronologique) ne génèrent pas de modèle formé au format iLearner. Toutefois, ils prennent des données d’apprentissage et créent un modèle en interne, qui peut ensuite être utilisé pour effectuer des prédictions. Pour les utiliser, il vous suffit de configurer les paramètres et de fournir des données.
Enregistrer une capture instantanée d’un modèle formé
Si vous souhaitez enregistrer ou exporter le modèle, cliquez avec le bouton droit sur le module formation, puis sélectionnez enregistrer en tant que modèle formé. Le modèle est exporté au format iLearner et enregistré dans votre espace de travail, sous modèles formés. Les modèles formés peuvent être réutilisés dans d’autres expériences ou être connectés à d’autres modules pour la notation.
Vous pouvez également utiliser le module charger le modèle formé dans une expérience pour récupérer un modèle stocké.
Liste des modules
La catégorie train comprend les modules suivants :
- Clustering de balayage: effectue un balayage de paramètre sur un modèle de clustering pour déterminer les paramètres optimaux des paramètres et forme le meilleur modèle.
- Apprentissage du modèle de détection d’anomalie: forme un modèle de détecteur d’anomalie et étiquette les données d’un jeu d’apprentissage.
- Apprentissage du modèle de clustering: forme un modèle de clustering et affecte les données du jeu d’apprentissage aux clusters.
- Formation Matchbox-recommandation: effectue l’apprentissage d’un recommandation bayésienne à l’aide de l’algorithme Matchbox.
- Former le modèle: forme un modèle de classification ou de régression à partir d’un jeu d’apprentissage.
- Réglage des hyperparamètres de modèle: effectue un balayage de paramètre sur un modèle de régression ou de classification pour déterminer les paramètres optimaux des paramètres et forme le meilleur modèle.
Tâches associées
Certains modules ne sont pas dans cette catégorie, car ils requièrent un format spécial ou sont personnalisés pour une tâche spécifique :
- Former le modèle de détection des anomalies
- Formation vowpal Wabbit version 7-4
- Formation vowpal Wabbit version 7-10
- Formation vowpal Wabbit version 8
- Allocation de Dirichlet latente