クラスタリング モデルのトレーニング
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
クラスタリング モデルをトレーニングし、トレーニング セットのデータをクラスターに割り当てます
カテゴリ: Machine Learning/トレーニング
注意
適用対象: Machine Learning Studio (クラシック)のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
モジュールの概要
この記事では、Machine Learning Studio (クラシック) の [クラスタリングモデルのトレーニング] モジュールを使用して、クラスターモデルをトレーニングする方法について説明します。
このモジュールは、K-Means Clustering (K-Means クラスタリング) モジュールを使用して既に構成済みのトレーニングされていないクラスタリング モデルを取得し、ラベル付きまたはラベルなしデータセットを使用してそのモデルをトレーニングします。 このモジュールは、予測に使用できるトレーニング済みモデルと、トレーニング データの各ケースに対するクラスター割り当てセットの両方を作成します。
注意
モデルのトレーニングモジュールを使用してクラスターモデルをトレーニングすることはできません。これは、機械学習モデルを作成するための汎用モジュールです。 これは、Train Model (モデルのトレーニング) が教師あり学習アルゴリズムでのみ動作するためです。 K 平均法と他のクラスタリング アルゴリズムは教師なし学習を可能にします。これは、アルゴリズムがラベルなしデータから学習できることを意味します。
クラスタリング モデルのトレーニングの使用方法
Studio (クラシック) で、実験に " クラスターモデルのトレーニング " モジュールを追加します。 このモジュールは、Machine Learning モジュールの [トレーニング] カテゴリにあります。
K-Means Clustering (K-Means クラスタリング) モジュール、または互換性のあるクラスタリング モデルを作成する別のカスタム モジュールを追加し、クラスタリング モデルのパラメーターを設定します。
[Train Clustering Model]\(クラスタリング モデルのトレーニング\) の右側の入力にトレーニング データセットをアタッチします。
[Column Set]\(列セット\) で、クラスターの構築に使用するデータセットの列を選択します。 適切な特徴となる列を必ず選択してください。たとえば、一意の値を持つ ID やその他の列、またはすべて同じ値を持つ列は使用しないようにします。
ラベルが使用可能な場合は、特徴として使用することも、除外することもできます。
トレーニングデータを新しいクラスターラベルと共に出力する場合は、オプションを選択し、[ 追加] チェックボックスをオンにします。
このオプションの選択を解除すると、クラスターの割り当てだけが出力されます。
実験を実行するか、Train Clustering Model (クラスタリング モデルのトレーニング) モジュールをクリックして [選択した項目を実行] を選択します。
結果
トレーニングの完了後、次の作業を行います。
クラスターとその分離をグラフで表示するには、 結果データセット 出力を右クリックし、[ 視覚化] を選択します。
グラフは、実際の値ではなく、クラスターの主要なコンポーネントを表します。 詳細については、「 主要コンポーネントの分析 」を参照してください。
データセット内の値を表示するには、データセット への変換 モジュールのインスタンスを追加し、 結果のデータセット の出力に接続します。 データ セットへの変換 モジュールを実行して、表示またはダウンロードできるデータのコピーを取得します。
トレーニング済みのモデルを保存して後で再利用できるようにするには、モジュールを右クリックし、[Trained model]\(トレーニング済みのモデル\) を選択して [Save As Trained Model]\(トレーニング済みのモデルとして保存する\) をクリックします。
モデルからスコアを生成するには、「クラスターへのデータの割り当て」を使用します。
例
機械学習でクラスタリングを使用する方法の例については、 Azure AI Galleryを参照してください。
クラスタリング: 類似企業の検索: 非構造化テキストから派生した属性に対してクラスタリングを使用する方法を示します。
クラスタリング: カラー量子化: クラスタリングを使用して関連する色を検索し、イメージで使用されるビット数を減らす方法を示します。
クラスタリング: グループの虹彩データ: 虹彩データセットに基づくクラスタリングの簡単な例を示します。
想定される入力
名前 | 型 | 説明 |
---|---|---|
未トレーニング モデル | ICluster インターフェイス | 未トレーニング クラスタリング モデル |
データセット | データ テーブル | 入力データ ソース |
モジュールのパラメーター
名前 | Range | Type | Default | 説明 |
---|---|---|---|---|
列セット | any | ColumnSelection | 列選択パターン | |
オンで追加またはオフで結果のみ | any | Boolean | true | 出力データセットに割り当て列により追加された入力データセットを含めるか (チェック)、割り当て列のみを含めるか (チェック解除) |
出力
名前 | 型 | 説明 |
---|---|---|
トレーニングされたモデル | ICluster インターフェイス | トレーニング済みクラスタリング モデル |
結果のデータセット | データ テーブル | 割り当てのデータ列により追加された入力データセットまたは割り当て列のみ |
例外
例外 | 説明 |
---|---|
エラー 0003 | 1 つまたは複数の入力が null または空の場合、例外が発生します。 |
Studio (クラシック) モジュール固有のエラーの一覧については、「 Machine Learning エラーコード」を参照してください。
API 例外の一覧については、「 Machine Learning REST API のエラーコード」を参照してください。