ML Studio (クラシック) モジュールの機械学習モジュール
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
機械学習の一般的なワークフローには多くのフェーズが含まれています。
解決する問題と、結果を測定するためのメトリックを特定する。
適切なデータの検索、クリーニング、準備。
最適な機能を特定し、新しい機能をエンジニアリングする。
モデルの構築、評価、チューニング。
モデルを使用して予測、推奨事項、その他の結果を生成する。
このセクションのモジュールでは、機械学習の最終フェーズ用のツールを提供します。このツールでは、アルゴリズムをデータに適用してモデルをトレーニングします。 これらの最終フェーズでは、スコアを生成し、モデルの精度と便利さを評価します。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
カテゴリ別の機械学習タスクの一覧
-
クラスタリング、回帰、分類、異常検出モデルなど、さまざまなカスタマイズ可能な機械学習アルゴリズムから選択できます。
-
パターンから学習し、予測に使用できる統計を作成するために、構成済みのモデルにデータを提供します。
-
トレーニング済みのモデルを使用して予測を作成します。
-
トレーニング済みのモデルの精度を測定するか、複数のモデルを比較します。
この実験的なワークフローの詳細については、信用リスク ソリューションの チュートリアルを参照してください。
前提条件
モデルの構築の楽しい部分に取り入れる前に、通常は多くの準備が必要です。 このセクションでは、データのクリーンアップ、入力の品質の向上、実行時エラーの防止に役立つ Machine Learning Studio (クラシック) のツールへのリンクを示します。
データ探索とデータ品質
選択したアルゴリズムに対して、データが適切な種類のデータ、適切な数量、および適切な品質である必要があります。 データの量とデータの分散方法を理解します。 外れ値はありますか。 それらの生成方法と意味は何ですか? 重複するレコードはありますか。
不足値を処理する
不足値はさまざまな面で結果に影響を与えます。 たとえば、ほとんどすべての統計的手法で不足値のあるケースが破棄されます。 既定では、値Machine Learning行が検出された場合は、次の規則に従います。
モデルのトレーニングに使用されるデータに不足値がある場合、不足値を含む行はスキップされます。
モデルに対するスコアリング時に入力として使用されるデータに欠損値がある場合、欠損値は入力として使用されますが、null は伝達されます。 これは通常、有効な予測ではなく、結果に null が挿入されるという意味です。
モデルをトレーニングする前に、必ずデータを確認してください。 不足している値を入力したり、データを修正したりするには、次のモジュールを使用します。
特徴の選択と次元の削減
Machine Learning Studio (クラシック) を使用すると、最も役に立つ属性を見つけるためにデータを切り分けるのに役立ちます。
[線状判別分析] や [フィルターベースの特徴選択] などのツールを使用して、予測力が最も高いデータ列を特定します。 これらのツールでは、データ漏えいのために削除する必要がある列を識別することもできます。
既存のデータから機能を作成または設計します。 データを正規化したり 、 データをビン にグループ化してデータを新しいグループ化したり、分析の前に数値の範囲を標準化したりします。
カテゴリ値をグループ化するか、プリンシパル コンポーネント分析を使用するか、サンプリングを使用して、次元を減らします。
例
実際の機械学習の例については、次のページを Azure AI Gallery。
ヒントと一般的なデータ準備タスクのチュートリアルについては、「 Team Data Science Process を実行するチュートリアル」を参照してください。