モデル トレーニングの例
このセクションには、多くの一般的なオープンソース ライブラリを使用して、Azure Databricks で機械学習モデルをトレーニングする方法を示す例があります。
さらに、AutoML を使用すれば、モデル トレーニング用のデータセットを自動的に準備し、scikit-learn や XGBoost などのオープンソース ライブラリを使用して一連のトライアルを実行し、トライアルの実行ごとにソース コードを含む Python ノートブックを作成して、コードを確認、再現、変更できます。
機械学習の例
Package | ノートブック | 機能 |
---|---|---|
scikit-learn | 機械学習のチュートリアル | Unity カタログ、分類モデル、MLflow、Hyperopt および MLflow を使用したハイパーパラメーターの自動チューニング |
scikit-learn | エンド ツー エンドの例 | Unity カタログ、分類モデル、MLflow、Hyperopt および MLflow、XGBoost を使用したハイパーパラメーターの自動チューニング |
MLlib | MLlib の例 | 二項分類、デシジョン ツリー、GBT 回帰、構造化ストリーミング、カスタム トランスフォーマー |
xgboost | XGBoost の例 | Python、PySpark、Scala、単一ノードワークロード、分散トレーニング |
ハイパーパラメーター チューニングの例
Azure Databricks でのハイパーパラメーターのチューニングに関する一般的な情報については、「ハイパーパラメーターの調整」を参照してください。
Package | ノートブック | 機能 |
---|---|---|
Optuna | Optuna の概要 | Optuna、分散された Optuna、Scikit-learn、MLflow |
Hyperopt | 分散 hyperopt | 分散 hyperopt、scikit-learn、MLflow |
Hyperopt | モデルの比較 | 分散 hyperopt を使用して、ハイパーパラメーター空間でさまざまなモデルの種類を同時に検索します |
Hyperopt | 分散トレーニングのアルゴリズムと hyperopt | Hyperopt、MLlib |
Hyperopt | Hyperopt のベスト プラクティス | さまざまなサイズのデータセットでのベスト プラクティス |