Machine Learning-トレーニング
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
この記事では、Machine Learning モデルをトレーニングするための Machine Learning Studio (クラシック) で提供されているモジュールについて説明します。 トレーニング は、定義済みモデルのパラメーターを使用して入力データを分析するプロセスです。 この分析から、モデルはパターンを学習し、トレーニング済みのモデルの形式で保存します。
注意
適用対象: Machine Learning Studio (クラシック)のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
この記事では、モデルの作成、トレーニング、評価、およびスコア付けのための Machine Learning Studio (クラシック) の全体的なプロセスについても説明します。
機械学習モデルを作成して使用する
機械学習の一般的なワークフローには、次のフェーズが含まれます。
- 適切なアルゴリズムを選択し、初期オプションを設定します。
- 互換性のあるデータに対してモデルをトレーニングします。
- モデル内のパターンに基づいて、新しいデータを使用して予測を作成する。
- モデルを評価して、予測が正確であるかどうか、どのくらいのエラーがあるか、オーバーフィットがあるかどうかを判断します。
Machine Learning Studio (クラシック) は、柔軟でカスタマイズ可能な機械学習のフレームワークをサポートしています。 このプロセスの各タスクは、特定の種類のモジュールによって実行されます。これは、変更、追加、または削除することができます。実験の残りの部分は中断されません。
このカテゴリのモジュールは、さまざまな種類のモデルのトレーニングをサポートしています。 トレーニング中に、機械学習アルゴリズムによってデータが分析されます。 このアルゴリズムでは、データの分布と種類を分析し、統計をコンパイルして、後で予測に使用できるパターンを作成します。
モデルトレーニングの詳細
モデルのトレーニングを Machine Learning と、不足値がある行はスキップされます。 そのため、値を手動で修正する場合、または不足値を処理する別の方法を指定する場合は、データセットのトレーニングの前に、 欠損データのクリーンアップ モジュールを使用します。
データに関するその他の問題を修正するには、 メタデータの編集 モジュールを使用することをお勧めします。 場合によっては、ラベル列のマーク付け、データ型の変更、または列名の修正が必要になることがあります。
正規化、サンプリング、ビン分割、スケーリングなど、その他の一般的なデータクリーンアップタスクについては、「 データ変換 」カテゴリを参照してください。
適切トレーナーを選択する
モデルのトレーニングに使用する方法は、作成するモデルの種類と、モデルに必要なデータの種類によって異なります。 たとえば、Machine Learning には、異常検出モデルのトレーニング専用のモジュール、推奨モデルなどが用意されています。
トレーニングモジュールの一覧を確認して、実際のシナリオに適したものを特定します。
モデルのトレーニング時に使用する最適なパラメーターがわからない場合は、パラメーターのスイープと検証に用意されているモジュールのいずれかを使用します。
チューニングモデル Hyperparameters は、ほぼすべての分類モデルと回帰モデルに対してパラメータースイープを実行できます。 複数のモデルをトレーニングし、最適なモデルを返します。
スイープクラスタリングモジュールは、トレーニングプロセス中のモデルの調整をサポートしており、クラスターモデルでのみ使用されます。 重心の範囲を指定し、データをトレーニングして、最適なパラメーターを自動的に検出することができます。
モデルの クロス検証 モジュールは、モデルの最適化にも役立ちますが、トレーニング済みのモデルは返しません。 代わりに、最適なモデルを決定するために使用できるメトリックが用意されています。
モデルの再トレーニング
実稼働モデルを再トレーニングする必要がある場合は、いつでも実験を再実行できます。
Web サービスを使用して再トレーニングプロセスを自動化することもできます。 チュートリアルについては、「 Azure Data Factory を使用した Machine Learning モデルの再トレーニングと更新」を参照してください。
事前トレーニング済みのモデルを使用する
Machine Learning には、事前トレーニング済みカスケードイメージ分類モジュールなどの事前トレーニング済みのモデルが含まれています。 これらのモデルは、データ入力を追加せずにスコアリングに使用できます。
また、一部のモジュール ( タイムシリーズの異常検出など) では、ilのような形式でトレーニング済みのモデルが生成されません。 しかし、トレーニングデータを取得し、モデルを内部的に作成することで、予測を行うことができます。 これらを使用するには、パラメーターを構成し、データを指定するだけです。
トレーニング済みのモデルのスナップショットを保存する
モデルを保存またはエクスポートする場合は、トレーニングモジュールを右クリックし、[トレーニング済みの モデルとして保存] を選択します。 モデルは、トレーニング済みの モデルの下で、ilのような形式にエクスポートされ、ワークスペースに保存されます。 トレーニング済みのモデルは、他の実験で再利用したり、スコアリングのために他のモジュールに接続したりすることができます。
実験の "トレーニング済み モデルの読み込み " モジュールを使用して、格納されているモデルを取得することもできます。
モジュールの一覧
Trainカテゴリには、次のモジュールが含まれています。
- スイープクラスタリング: クラスターモデルに対してパラメータースイープを実行し、最適なパラメーター設定を決定し、最適なモデルをトレーニングします。
- 異常検出モデルのトレーニング: 異常検出モデルをトレーニングし、トレーニングセットのデータにラベルを付けます。
- クラスターモデルのトレーニング: クラスターモデルをトレーニングし、トレーニングセットからクラスターにデータを割り当てます。
- マッチボックスレコメンダーのトレーニング: matchbox アルゴリズムを使用してベイジアンレコメンダーをトレーニングします。
- モデルのトレーニング: トレーニングセットから分類モデルまたは回帰モデルをトレーニングします。
- モデルハイパーパラメーターの調整: 回帰モデルまたは分類モデルに対してパラメータースイープを実行し、最適なパラメーター設定を決定し、最適なモデルをトレーニングします。
関連タスク
一部のモジュールは、特別な形式が必要であるか、特定のタスク用にカスタマイズされているため、このカテゴリに含まれていません。
- 異常検出モデルのトレーニング
- Vowpal Wabbit バージョン7-4 のトレーニング
- Vowpal Wabbit バージョン7-10 のトレーニング
- Vowpal Wabbit バージョン8のトレーニング
- Latent Dirichlet Allocation