ML Studio (クラシック) モジュールの説明
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
このトピックでは、Machine Learning Studio (クラシック) に含まれるすべてのモジュールの概要について説明します。これは、予測モデルを簡単に構築してテストするための対話型のビジュアル ワークスペースです。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
モジュールとは何ですか。
Machine Learning Studio (クラシック) では、モジュールは実験を作成するための構成ブロックです。 各モジュールは、ワークスペース内のデータに対して機能できる特定の機械学習アルゴリズム、関数、またはコード ライブラリをカプセル化します。 モジュールは、他のモジュールからの接続を受け入れ、データを共有および変更するように設計されています。
各モジュールで実行されるコードは、多くのソースから取得されます。 これには、オープンソースライブラリと言語、Microsoft Research によって開発されたアルゴリズム、Azure や他のクラウド サービスを操作するためのツールが含まれます。
ヒント
機械学習アルゴリズムをお探しの場合 「Machine Learning」カテゴリを参照してください。このカテゴリには、特に、意思決定ツリー、クラスタリング、ニューラル ネットワークのモジュールが含まれています。 トレーニングカテゴリと評価カテゴリには、モデルのトレーニングとテストに役立つモジュールが含まれています。
モジュールを接続して構成することで、外部ソースからデータを読み取り、分析用に準備し、機械学習アルゴリズムを適用して結果を生成するワークフローを作成できます。
Machine Learning Studio (クラシック) で実験を開いていると、左側のナビゲーション ウィンドウに現在のモジュールの完全な一覧が表示されます。 これらの構成要素を実験にドラッグし、それらを接続して、実験と呼ばれる完全な機械学習ワークフローを作成します。
新しい機能を追加したり、古いコードを削除したりするためにモジュールが更新される場合があります。 この場合、モジュールを使用して作成した実験は引き続き実行されます。 ただし、次回実験を開く場合は、モジュールをアップグレードするか、別のモジュールを使用するように求めるメッセージが表示されます。
例
完全な機械学習実験を構築する方法の例については、次のチュートリアルを参照してください。
モジュールのカテゴリ
関連するモジュールを見つけやすくするために、Machine Learning Studio (クラシック) の機械学習ツールは、これらのカテゴリ別にグループ化されています。
データ形式の変換
このカテゴリに含まれるモジュールは、データを他の機械学習ツールのデータ形式に変換する場合に使用します。
-
これらのモジュールを使用して、Hadoop クラスター、Azure Table Storage、Web URL などのクラウド データ ソースからデータとモデルを読み取る。 これらのモジュールを使用して、ストレージまたはデータベースに結果を書き込む場合にも使用できます。
-
このカテゴリに含まれるモジュールは、分析用データを作成する場合に使用します。 データ型の変更、特徴またはラベルとしての列のフラグ設定、特徴の生成、データのスケーリングまたは正規化を行います。
-
デジタルシグナル処理から派生した数値データを変換します。
-
大規模なデータセットをコンパクトに記述する特徴を構築するには、関節確率分布を使用します。
-
このグループでは、データ サイエンス用のさまざまなツールを提供します。 たとえば、欠損値の削除または置換、列のサブセットの選択、列の追加、または 2 つのデータセットの連結を行います。
-
データセットを条件またはサイズで分割し、トレーニング セットとテスト セットを作成したり、特定の行を分離したりします。
-
数値データを変換します。
特徴選択
このカテゴリに含まれるモジュールは、広範に研究されている統計的手法でデータの最も優れた特徴を識別する場合に使用します。
Machine Learning
このグループには、このグループでサポートされている機械学習アルゴリズムのほとんどがMachine Learning。
また、モデルのトレーニング、スコアの生成、モデルのパフォーマンスの評価によってアルゴリズムをサポートすることを目的としたモジュールも含まれています。
-
モデルをトレーニングした後、これらのツールを使用してモデルの精度を測定します。
-
これらのモジュールは、パラメーターを設定してカスタマイズできる機械学習アルゴリズムを提供します。 このセクションのアルゴリズムは、次の種類でグループ化されています。
-
これらのモジュールを使用して、アルゴリズムを介して新しいデータを渡し、評価のための一連の結果を生成します。 スコアリングの結果を予測サービスの一部として使用できます。
-
これらのモジュールは、指定したデータに対して初期化された機械学習モデルをトレーニングします。
OpenCV ライブラリ モジュール
このカテゴリに含まれるモジュールを使用すると、一般的なオープン ソース ライブラリに簡単にアクセスしてイメージの処理や分類を行うことができます。
R 言語モジュール
このカテゴリに含まれるモジュールは、カスタムの R コードを実験に追加したり、R パッケージに基づいて機械学習モデルを実装する場合に使用します。
Python 言語モジュール
このカテゴリに含まれるモジュールは、カスタムの Python コードを実験に追加する場合に使用します。
統計関数
このカテゴリに含まれるモジュールは、確率分布の計算、カスタムの計算タスクの作成など、数値変数に関連するさまざまなタスクを実行する場合に使用します。
Text Analytics
これらのモジュールを使用して、特徴ハッシュと名前付きエンティティ認識を実行したり、自然言語処理ツールを使用してテキストを前処理したりします。
時系列
時系列データ専用に設計されたアルゴリズムを使用して、これらのモジュールを使用して傾向の異常を評価します。
関連タスク
Machine Learning Studio (クラシック) モジュールでは、他のツール (Azure Data Factory など) でサポートされているデータ統合ツールの複製は試みAzure Data Factory。 代わりに、モジュールは機械学習に固有の機能を提供します。
- データの正規化、グループ化、スケーリング
- データの統計分布の計算
- 他の機械学習形式への変換
- 機械学習の実験に使用されるデータのインポートと結果のエクスポート
- テキスト分析、特徴選択、および次元の削減
データ操作とストレージにさらに高度な機能が必要な場合は、次を参照してください。
- Azure Data Factory: Enterprise対応のクラウド データ処理パイプライン。
- Azure SQL Database: 機械学習への統合アクセスを備えたスケーラブルなストレージ。
- CosmosDB: NoSQL データ ストア。Machine Learning Studio (クラシック) にデータをインポートします。
- Azure Data Lake Analytics: ビッグ データに対する分散分析。
- Stream Analytics: イベントのイベント処理モノのインターネット。
- Azure Text Analytics: テキスト処理のための複数のオプションと、音声、画像、顔認識Cognitive Services関連するデータ。
- Azure Databricks: Spark ベースの分析プラットフォーム。