クラスタリング手法を適用する

3 分

クラスタリングを使用すると、相互に似ているが残りのデータとは異なるセグメント (クラスター) を識別できます。クラスタリングのプロセスは、前に行ったグループ化とは異なります。

Power BI のクラスタリング機能を使用すると、データのサブセットから、類似したデータポイントを持つグループをすばやく検索できます。セマンティックモデルを分析して、属性値の類似点と相違点を識別し、類似点を持つデータをデータのサブセットに分割します。これらのデータのサブセットは、"クラスター" と呼ばれます。

たとえば、売上データから、顧客全体の行動などのパターンを見つけたい場合もあります。顧客を年齢や場所などの類似性に基づいて、クラスターに分割することができます。

まず始めに、[散布図] 視覚エフェクトをレポートに追加し、次に必要なフィールドを視覚化に追加します。この例では、[Order Qty] フィールドを X 軸に、[Sales] フィールドを Y 軸に、[Unit Price] を [値] フィールドに追加します。次の図では、散布図に非常に多くのデータが示されているため、自然なグループを識別するのは困難です。

散布図にクラスタリングを適用するには、視覚化の右上隅にある [その他のオプション] (...) を選択し、[クラスターの自動検索] を選択します。

表示される [クラスター] ウィンドウで、必要に応じて、既定の名前、フィールド、および説明を編集できます。ただし、この例ではクラスターの数を変更する必要があります。次の図に示すように、[クラスターの数] ボックスは既定では空白です。これは、そのデータについて最も意味があると思われるクラスター数が Power BI によって自動検出されることを意味します。

必要なクラスターの数 (3) をボックスに入力し、[OK] を選択します。 Power BI によってクラスタリングアルゴリズムが実行され、別々のクラスターグループを含む新しいカテゴリフィールドが作成されます。ここで視覚化を確認すると、データ内のクラスターを明確に見つけることができ、クラスター分析の実行に進むことができます。

新しいクラスターフィールドが、散布図の [凡例] フィールドのウェルバケットに追加され、他の [凡例] フィールドと同様にクロス強調表示のソースとして使用できるようになります。また、他のフィールドと同じように、新しいクラスターフィールドをフィールドの一覧から検索して、新しい視覚化で使用することもできます。

クラスターを編集する場合は、クラスターフィールドを右クリックし、[クラスターの編集] を選択します。

上の例では、クラスタリングを散布図に適用した場合、2 つのメジャーしか使用できませんでした。 2 つ以上のメジャーを使用してクラスターを見つける場合は、代わりにテーブル視覚化を使用し、使用するすべてのフィールドを追加してから、同じプロセスを使用してクラスタリングアルゴリズムを実行することができます。

クラスタリング手法を適用する

フィードバック