コンポーネント: クラスターへのデータの割り当て
この記事では、Azure Machine Learning デザイナーの "クラスターへのデータの割り当て" コンポーネントを使用する方法について説明します。 このコンポーネントでは、K-Means クラスタリング アルゴリズムでトレーニングされたクラスタリング モデルを介して予測を生成します。
Assign Data to Clusters (データのクラスターへの割り当て) コンポーネントは、新しい各データ ポイントの推定の割り当てを含むデータセットを返します。
クラスターへのデータの割り当てを使用する方法
Azure Machine Learning デザイナーで、以前にトレーニングしたクラスタリング モデルを見つけます。 以下のいずれかの方法を使用して、クラスタリング モデルを作成およびトレーニングできます。
K-Means Clustering (K-Means クラスタリング) コンポーネントを使用して K-Means クラスタリング アルゴリズムを構成し、データセットと Train Clustering Model (クラスタリング モデルのトレーニング) コンポーネント (この記事) を使用してモデルをトレーニングします。
また、トレーニング済みの既存のクラスタリング モデルを、ワークスペースの [Saved Models]\(保存済みのモデル\) グループから追加することもできます。
トレーニング済みのモデルを Assign Data to Clusters (クラスターへのデータの割り当て) の左側の入力ポートにアタッチします。
新しいデータセットを入力としてアタッチします。
このデータセットでは、ラベルは省略可能です。 一般に、クラスタリングは教師なしの学習方法です。 事前にカテゴリを知ることは想定されていません。 ただし、入力列はクラスタリング モデルのトレーニングで使用された列と同じである必要があり、同じでないとエラーが発生します。
ヒント
クラスター予測からデザイナーに書き込まれる列数を減らすには、[Select columns in the dataset]\(データセット内の列の選択\) を使用して列の一部を選択します。
結果 (クラスターの割り当て) を表示する列を含め、入力データセット全体を結果に含める場合は、 [Check for append or uncheck for result only]\(追加をチェックまたは結果のみをチェック解除\) チェック ボックスをオンのままにします。
このチェック ボックスをオフにすると、結果のみが返されます。 このオプションは、Web サービスの一部として予測を作成するときに役立ちます。
パイプラインを送信します。
結果
- データセット内の値を表示するには、コンポーネントを右クリックして [可視化] を選択します。 または、コンポーネントを選択し、右側のパネルの [出力] タブに切り替え、 [Port outputs]\(ポートの出力\) 内のヒストグラム アイコンをクリックして結果を可視化します。