Exemples d’entraînement de modèle
Cette section comprend des exemples illustrant comment former des modèles d’apprentissage automatique sur Azure Databricks à l’aide de nombreuses bibliothèques open source populaires.
Vous pouvez également utiliser AutoML, qui prépare automatiquement un jeu de données pour l’entraînement des modèles, effectue un ensemble d’essais à l’aide de bibliothèques open source, telles que scikit-learn et XGBoost, et crée un notebook Python avec le code source pour chaque exécution d’essai afin que vous puissiez examiner, reproduire et modifier le code.
Exemples de machine learning
Package | Notebook(s) | Fonctionnalités |
---|---|---|
scikit-learn | Didacticiel de Machine Learning | Unity Catalog, modèle de classification, MLflow, optimisation automatisée des hyperparamètres avec Hyperopt et MLflow |
scikit-learn | Exemple de bout en bout | Unity Catalog, modèle de classification, MLflow, optimisation automatisée des hyperparamètres avec Hyperopt et MLflow, XGBoost |
MLlib | Exemples de MLlib | Classification binaire, arbres de décision, régression GBT, Structured Streaming, transformateur personnalisé |
xgboost | Exemples de XGBoost | Python, PySpark et Scala, charges de travail mononœuds et entraînement distribué |
Exemple de réglage des hyperparamètres
Pour obtenir des informations générales sur le réglage des hyperparamètres dans Azure Databricks, consultez Réglage des hyperparamètres.
Package | Notebook | Fonctionnalités |
---|---|---|
Optuna | Bien démarrer avec Optuna | Optuna, Optuna distribué, scikit-learn, MLflow |
Hyperopt | Hyperopt distribué | Hyperopt distribué, scikit-learn, MLflow |
Hyperopt | Comparer des modèles | Utiliser l’hyperopt distribué pour rechercher simultanément l’espace des hyperparamètres de différents types de modèles |
Hyperopt | Algorithmes d’entraînement distribué et hyperopt | Hyperopt, MLlib |
Hyperopt | Bonnes pratiques pour Hyperopt | Bonnes pratiques pour les jeux de données de différentes tailles |