Partager via


Qu’est-ce que le Machine Learning automatisé (AutoML) ?

Le machine learning automatisé (AutoML) automatise le processus d’application du machine learning aux données. En utilisant un jeu de données, vous pouvez exécuter AutoML pour itérer sur différentes transformations de données, algorithmes de machine learning et hyperparamètres afin de sélectionner le meilleur modèle.

Remarque

Cet article fait référence à l’API AutoML ML.NET actuellement en préversion. Ce matériau peut être sujet à modification.

Comment fonctionne AutoML ?

En général, le flux de travail permettant de former des modèles Machine Learning est le suivant :

  • Définir un problème
  • Collecter les données
  • Traitement préalable des données
  • Effectuer l’apprentissage d’un modèle
  • Évaluer le modèle

Workflow de formation ML et AutoML traditionnel

Le prétraitement, la formation et l’évaluation sont un processus expérimental et itératif qui nécessite plusieurs essais jusqu’à ce que vous obteniez des résultats satisfaisants. Étant donné que ces tâches ont tendance à être répétitives, AutoML peut vous aider à automatiser ces étapes. En plus de l’automatisation, des techniques d’optimisation sont utilisées pendant le processus de formation et d’évaluation pour rechercher et sélectionner des algorithmes et des hyperparamètres.

Quand dois-je utiliser AutoML ?

Que vous commenciez seulement à utiliser le Machine Learning ou que vous soyez un utilisateur expérimenté, AutoML fournit des solutions pour automatiser le processus de développement de modèles.

  • Débutants : si vous débutez avec le Machine Learning, AutoML simplifie le processus de développement de modèles en fournissant un ensemble de valeurs par défaut qui réduit le nombre de décisions que vous devez prendre lors de la formation de votre modèle. Ce faisant, vous pouvez vous concentrer sur vos données et le problème que vous essayez de résoudre et laisser AutoML faire le reste.
  • Utilisateurs expérimentés : si vous avez une certaine expérience du Machine Learning, vous pouvez personnaliser, configurer et étendre les valeurs par défaut fournies par AutoML en fonction de vos besoins tout en tirant parti de ses fonctionnalités d’automatisation.

AutoML dans ML.NET

  • Featurizer : API pratique pour automatiser le prétraitement des données.
  • Essai : une seule exécution d’optimisation des hyperparamètres.
  • Expérience : collection d’essais AutoML. ML.NET fournit une API de haut niveau pour la création d’expériences qui définit les valeurs par défaut pour les composants Pipeline balayable, Espace de recherche et Tuner individuels.
  • Espace de recherche : plage d’options disponibles pour choisir des hyperparamètres.
  • Tuner : algorithmes utilisés pour optimiser les hyperparamètres. ML.NET prend en charge les tuners suivants :
    • Tuner frugal des coûts : implémentation de l’optimisation frugale pour les hyperparamètres liés aux coûts qui prend en considération le coût de formation
    • Eci Cost Frugal Tuner : implémentation de Cost Frugal Tuner pour les espaces de recherche hiérarchiques. Tuner par défaut utilisé par AutoML.
    • SMAC : tuner qui utilise des forêts aléatoires pour appliquer l’optimisation bayésienne.
    • Grid Search : tuner qui fonctionne le mieux pour les petits espaces de recherche.
    • Recherche aléatoire
  • Estimateur balayable : estimateur ML.NET qui contient un espace de recherche.
  • Pipeline balayable : pipeline ML.NET qui contient un ou plusieurs estimateurs balayables.
  • Exécuteur d’évaluation : composant AutoML qui utilise des pipelines balayables et des paramètres d’évaluation pour générer les résultats de l’essai à partir de la formation et de l’évaluation du modèle.

Il est recommandé pour les débutants de commencer avec les valeurs par défaut fournies par l’API d’expérience de haut niveau. Pour les utilisateurs plus expérimentés qui recherchent des options de personnalisation, utilisez les composants estimateur balayable, pipeline balayable, espace de recherche, exécuteur d’essai et tuner.

Pour plus d’informations sur la prise en main de l’API AutoML, consultez Comment utiliser l’API Machine Learning automatisé (AutoML) ML.NET.

Tâches prises en charge

AutoML fournit des valeurs par défaut préconfigurées pour les tâches suivantes :

  • Classification binaire
  • Classification multiclasse
  • régression ;

Pour d’autres tâches, vous pouvez créer votre propre exécuteur d’évaluation pour activer ces scénarios. Pour plus d’informations, consultez Comment utiliser l’API Machine Learning automatisé (AutoML) ML.NET.

Étapes suivantes