Beispiele für das Modelltraining
Dieser Abschnitt enthält Beispiele zum Trainieren von Machine Learning-Modellen in Azure Databricks mithilfe vieler gängiger Open-Source-Bibliotheken.
Sie können auch Mosaik AutoML verwenden, das automatisch ein Dataset für die Modellschulung vorbereitet, eine Reihe von Testversionen mithilfe von Open-Source-Bibliotheken wie scikit-learn und XGBoost durchführt und ein Python-Notizbuch mit dem Quellcode für jede Testausführung erstellt, sodass Sie den Code überprüfen, reproduzieren und ändern können.
Beispiele für Machine Learning
Paket | Notebook(s) | Features |
---|---|---|
scikit-learn | Machine Learning-Tutorial | Unity Catalog, Klassifizierungsmodell, MLflow, automatisierte Hyperparameteroptimierung mit Hyperopt und MLflow |
scikit-learn | End-to-End-Beispiel | Unity Catalog, Klassifizierungsmodell, MLflow, automatisierte Hyperparameteroptimierung mit Hyperopt und MLflow, XGBoost |
MLlib | MLlib-Beispiele | Binärklassifizierung, Entscheidungsstrukturen, GBT-Regression, strukturiertes Streaming, benutzerdefinierter Transformator |
xgboost | XGBoost-Beispiele | Python, PySpark und Scala, Einzelknoten-Workloads und verteiltes Training |
Hyperparameter-Optimierungsbeispiele
Allgemeine Informationen zur Hyperparameteroptimierung in Azure Databricks finden Sie unter Hyperparameteroptimierung.
Paket | Notebook | Features |
---|---|---|
Optuna | Erste Schritte mit Optuna | Optuna, verteiltes Optuna, Scikit-learn, MLflow |
Hyperopt | Hyperopt (verteilt) | Hyperopt (verteilt), Scikit-learn, MLflow |
Hyperopt | Vergleichen von Modellen | Verwenden von Hyperopt (verteilt) zum gleichzeitigen Durchsuchen des Hyperparameterraums für verschiedene Modelltypen |
Hyperopt | Verteilte Trainingsalgorithmen und Hyperopt | Hyperopt, MLlib |
Hyperopt | Hyperopt: bewährte Methoden | Bewährte Methoden für Datasets unterschiedlicher Größe |