Příklady trénování modelů
Tato část obsahuje příklady, které ukazují, jak trénovat modely strojového učení v Azure Databricks pomocí mnoha oblíbených opensourcových knihoven.
Můžete také použít autoML, který automaticky připraví datovou sadu pro trénování modelu, provede set zkušební verze pomocí opensourcových knihoven, jako jsou scikit-learn a XGBoost, a vytvoří poznámkový blok Pythonu se zdrojovým kódem pro každé zkušební spuštění, abyste mohli kontrolovat, reprodukovat a upravovat kód.
Příklady strojového učení
Balíček | Poznámkové bloky | Funkce |
---|---|---|
scikit-learn | Kurz strojového učení | Unity Catalog, klasifikační model, MLflow, automatizované ladění hyperparametrů pomocí Hyperoptu a MLflow |
scikit-learn | Kompletní příklad | Unity Catalog, klasifikační model, MLflow, automatizované ladění hyperparametrů s Hyperopt a MLflow, XGBoost |
MLlib | Příklady knihovny MLlib | Binární klasifikace, rozhodovací stromy, regrese GBT, strukturované streamování, vlastní transformátor |
xgboost | Příklady XGBoost | Python, PySpark a Scala, úlohy s jedním uzlem a distribuované trénování |
Příklady ladění hyperparametrů
Obecné informace o ladění hyperparametrů v Azure Databricks najdete v tématu Ladění hyperparametrů.
Balíček | Poznámkový blok | Funkce |
---|---|---|
Optuna | Get začal s Optuna | Optuna, distributed Optuna, scikit-learn, MLflow |
Hyperopt | Distribuovaný hyperopt | Distribuovaný hyperopt, scikit-learn, MLflow |
Hyperopt | Porovnání modelů | Použití distribuovaného hyperoptu k vyhledání prostoru hyperparametrů pro různé typy modelů současně |
Hyperopt | Distribuované trénovací algoritmy a hyperopt | Hyperopt, MLlib |
Hyperopt | Osvědčené postupy pro Hyperopt | Osvědčené postupy pro datové sady různých velikostí |