クラスタリング モジュール
重要
Machine Learning Studio (クラシック) のサポートは、2024 年 8 月 31 日に終了します。 その日までに、Azure Machine Learning に切り替えすることをお勧めします。
2021 年 12 月 1 日以降、新しい Machine Learning Studio (クラシック) リソースは作成できません。 2024 年 8 月 31 日まで、既存の Machine Learning Studio (クラシック) リソースを引き続き使用できます。
- ML Studio (クラシック) から Azure Machine Learning への機械学習プロジェクトの移動に関する情報を参照してください。
- Azure Machine Learning についての詳細を参照してください。
ML Studio (クラシック) のドキュメントは廃止予定であり、今後更新されない可能性があります。
この記事では、クラスタリング モデルの作成Machine Learning Studio (クラシック) のモジュールについて説明します。
注意
適用対象: Machine Learning Studio (クラシック) のみ
類似のドラッグ アンド ドロップ モジュールは Azure Machine Learning デザイナーで使用できます。
クラスタリングとはどのようなものでしょうか。
クラスタリングは、機械学習では、データ ポイントを同様のクラスターにグループ化する方法です。 セグメント化とも呼 ばれる。
長年にわたり、多くのクラスタリング アルゴリズムが開発されています。 ほぼすべてのクラスタリング アルゴリズムでは、個々の項目の機能を使用して類似の項目を検索します。 たとえば、クラスタリングを適用して、人口統計によって似た人を見つける場合があります。 テキスト分析によるクラスタリングを使用して、類似したトピックまたはセンチメントを含む文をグループ化することができます。
クラスタリングは、ラベル付けされていないデータで使用することができるため、非教師あり学習手法と呼ばれる。 実際、クラスタリングは新しいパターンを検出するための最初の手順として役立ちます。また、データの構造化方法や項目の関連付け方法に関する事前の知識はほとんど必要とされません。 クラスタリングは、他の予測アルゴリズムを使用して分析する前にデータを探索するためによく使用されます。
クラスタリング モデルを作成する方法
Machine Learning Studio (クラシック) では、ラベル付けされたデータまたはラベル付けされていないデータでクラスタリングを使用できます。
ラベル付けされていないデータでは、クラスタリング アルゴリズムによって最も近いデータ ポイントが決定され、中心点 (重心) の周りにクラスターが作成されます。 その後、クラスター ID をデータ グループの一時ラベルとして使用できます。
データにラベルがある場合は、ラベルを使用してクラスターの数を増やしたり、ラベルを別の機能として使用したりできます。
クラスタリング アルゴリズムを構成した後は、クラスタリング モデルのトレーニング モジュールまたはスイープ クラスタリング モジュールを使用して、データに対してトレーニングします。
モデルがトレーニングされている場合は、それを使用して、新しいデータ ポイントのクラスター メンバーシップを予測します。 たとえば、クラスタリングを使用して購入行動によって顧客をグループ化した場合、モデルを使用して新しい顧客の購入行動を予測できます。
モジュールの一覧
クラスタリング カテゴリには、次のモジュールが含まれています。
- K-Means クラスタリング: K-Means クラスタリング モデルを構成して初期化します。
関連タスク
別のクラスタリング アルゴリズムを使用するか、R を使用してカスタム クラスタリング モデルを作成するには、次のトピックを参照してください。
例
実際のクラスタリングの例については、次のページを Azure AI Gallery。
アルゴリズムの選択については、次の記事を参照してください。
Machine Learning Studio (クラシック) の機械学習アルゴリズム チート シート
選択プロセスをガイドするグラフィカルなデシジョン チャートを提供します。
クラスタリング、分類Machine Learning回帰のアルゴリズムを選択する方法
さまざまな種類の機械学習アルゴリズムと、その使い方について詳しく説明します。