買い物かご分析ツールは、データを見つけるassociations
のに役立ちます。 アソシエーションにより、同時に購入される頻度が高いアイテムがわかります。 データ マイニングでは、この手法は 市場バスケット分析と呼ばれるよく知られている方法であり、非常に大規模なデータ セット内の顧客の購入行動を分析するために使用されます。 マーケティング担当者は、この情報を使用して顧客に関連製品を提案したり、関連製品を Web ページ、カタログ、または棚の近接箇所に配置して宣伝したりすることができます。
買い物かご分析を使用するには、分析するアイテムがトランザクション ID で関連付けられている必要があります。 たとえば、Web サイトを通じて受け取ったすべての注文を分析する場合は、各注文に対して、1 つ以上の購入アイテムに関連付けられた注文 ID またはトランザクション ID が割り当てられます。
ウィザードでデータの分析が完了すると、 買い物かごアイテム グループと買い物かご ルールという 2 つの新しいワークシート が作成されます。
[ 買い物かごアイテム グループ] ワークシートには、トランザクションで頻繁に一緒に表示されるアイテムの一覧が含まれています。 これらの一般的なグループ化は 、アイテムセットと呼ばれます。 ワークシートには、アイテムセットの重要性を理解するのに役立つ 、サポート や リフトなどの統計も含まれています。 価格情報を使用できる場合は、すべての関連アイテムの価値合計もワークシートで作成され、トランザクションの合計値が示されます。
レポート内の列では、フィルター処理および並べ替えを実行できます。 たとえば、2 つ以上の製品を含むアイテムセットのみを表示したり、アイテムセットを 平均バスケット値で並べ替えたりすることができます。
[ 買い物かごルール] ワークシートでは、分析から派生した統計を使用して、アイテムの関連付け方法に関するルールを作成します。 たとえば、顧客が製品 A を購入すると、製品 B を購入する可能性が高いというルールが考えられます。ルールを使用して推奨事項を作成できます。 各ルールには、ルールの強さの評価に役立つサポート統計があり、ルールが特定の確率しきい値を超えた場合にのみ提案を行うことができます。
買い物かご分析ツールの使用
適切なデータが保存されている Excel テーブルを開きます。 サンプル ブックで [関連付け] ワークシートをクリックします。
[ 買い物かご分析] をクリックします。
[ 買い物かご分析 ] ダイアログ ボックスで、トランザクション ID を含む列を選択し、分析するアイテムまたは製品を含む列を選択します。
必要に応じて、製品価値を含む列を追加できます。
[詳細設定] をクリックして、[ 高度なパラメーター設定 ] ダイアログ ボックスを開きます。 [最小サポート] の値を増やして、アイテムセットとしてグループ化される製品の数を減らします。 [最小ルールの確率] を増やして、非常に一般的なアイテムセットを除外します。
要件
買い物かご分析ツールを使用するには、データを Excel テーブルに格納し、次の列を含める必要があります。
トランザクションを表す一意の ID が格納された列。 ID は、各行の値が一意である限り、数値でもテキストでもかまいません。
分析するアイテムまたは製品が格納された列。
各アイテムの価格または価値を表す数値列 (省略可能)。 この列を使用すると、各製品が属するアイテムセットの価値が集計され、特定のトランザクションの合計値を把握しやすくなります。
アイテムを関連付ける方法
分析する個々のアイテムは、ケース、トランザクション、またはイベントごとにグループ化する必要があります。 したがって、顧客 ID 番号や製品 ID 番号ではなく、このトランザクション ID 列を識別子として選択します。
ツールで各トランザクション内の製品が調べられると、検出されたアイテムの組み合わせごとにアイテムセットが作成されます。 たとえば、顧客が 1 回の訪問で 3 つのアイテムを購入した場合は、7 つのアイテムセットが考えられます (それぞれの製品、別の製品とグループ化された各製品、および 3 つすべての製品の組み合わせ)。
注意
アイテムが 1 つしか含まれないアイテムセットは除外できますが、ツールでは、データ セットの意味のある統計を生成するために、このようなアイテムセットを分析する必要があります。
各アイテムセットのサポートは、アイテムセットを購入した顧客の数として計算されます。 上で示した例では、3 つのアイテムを購入した顧客が 1 人だけの場合、7 つのアイテムセットが考えられますが、その 7 つのアイテムセットのそれぞれのサポート値は 1 になります。 顧客の数や考えられる組み合わせの数が増えると、レポートの処理にかかる時間が長くなる可能性があります。 ただし、その中にはサポートが非常に小さいアイテムセットも含まれます。 したがって、レポートの生成にかかる時間を短縮するには、各アイテムセットのアイテム数を 3 つ以下に制限します。 一般的に、アイテムセットが大きくなるとサポートが少なくなるので、このトレードオフは妥当です。
最小のサポートとルールの最小確率の指定
データ セットが大きくなると、考えられるアイテム グループおよびルールが膨大な数になる可能性があります。 ただし、ツールによって出力される結果の数を制御して、最も重要なアイテムセットおよびルールだけに絞り込むことができます。 これらのオプションは、[ 買い物かごの詳細パラメーター] ダイアログ ボックスで設定します。
最小のサポート
最小サポート とは、アイテムセットが重要と見なされるために特定のアイテムセットを含む必要があるトランザクションの数を意味します。 たとえば、10 個以上の異なるトランザクションで購入されているアイテムセット以外には関心がない場合があります。 アイテムセットの基準値のしきい値を制御するには 2 つの方法があり、両方とも Minimum サポート パラメーターを使用します。
絶対値として: ターゲットアイテムを含むトランザクションの数を表す数値を入力します。 たとえば「10」と入力すると、10 個以上の買い物かごに表示されたすべてのアイテムセットが結果に含まれます。
パーセンテージ: アイテムセットのコレクション全体に対する割合を表す数値を入力します。 たとえば「10」と指定すると、すべてのアイテムセットがカウントされ、そのアイテムセットの合計数の 10% 以上が対象のアイテムセットで構成されることになります。 データセットが非常に大きい場合は、カウントの代わりにパーセンテージを使用すると、最も重要な項目のグループ化に集中するのに役立ちます。
注意
アイテムセット数は、データ内のトランザクション数とは異なります。 各トランザクションには複数のアイテムセットが含まれる場合があります。ただし、ほとんどのアイテムセットは、データ セット全体で複数回繰り返し検出されます。
ルールの確率と重要度
ルールの確率は、そのルールが実際に発生する可能性を示します。 ルールの確率は、ルールをサポートするアイテムセットの頻度を使用して計算されます。 アイテムセットの発生頻度が非常に低い場合、そのアイテムセットの確率は低くなります。
ただし、確率が高いルールが必ずしも有用であるとは限りません。 購入される頻度が高いためにプロモーションを追加する必要がないことを示している場合もあります。 重要度では、ルールの有用性が測定されます。 予測によって新しい情報は提供されないため、ルールの確率が非常に高くてもその重要度は低い場合があります。 たとえば、すべてのアイテムセットに特定の状態の属性が含まれている場合、確率が非常に高くても、その状態を予測するルールはあまり意味がありません。
これらの設定を試して結果の違いを確認し、最も興味深いルールが生成される設定を特定するようにしてください。
レポートについて
買い物かご分析ツールは、2 つの補完的なレポートを作成します。 最初のレポートは、「 分析中に識別されたアイテムの重要なグループ」というタイトルで、検出されたすべてのアイテムセットの一覧を提供します。 Microsoft Excel の新しいテーブル ツールを使用して、データの並べ替え、フィルター処理、探索を行うことができます。
2 番目のレポートの " 買い物かごルール" は、最初のレポートに一覧表示されているアイテムセットに基づいて、どのような種類の推論を行うことができるかを示します。 データを調べて理解するにはアイテムセットの一覧の方が便利ですが、予測や提案を行うにはルールの一覧の方が便利です。
買い物かごアイテム グループ レポート
このレポートには、データ セットで検出されたアイテムに関して、有効なすべての組み合わせの一覧が示されます。 たとえば、トランザクション データに注文が含まれている場合、各注文について、 買い物かご分析 ツールは個々の品目が注文された回数を計算し、そのアイテムと他のアイテムのすべての組み合わせを計算します。
このレポートには、検出されたアイテムセットがリフト順に示されます。 リフトは、アイテムセットの重要度を示すスコアです。
レポート内の列 | 内容 |
---|---|
アイテム グループ | アイテムセット (アイテムの組み合わせ) を一覧表示します。 |
グループ サイズ | アイテムセット内のアイテム数。 このフィールドでフィルター処理を行い、アイテムのペアだけの表示や単一のアイテムだけの表示などを実行できます。 |
サポート | この組み合わせが検出されたケースの数。 この列を基準にして並べ替えを行い、最も一般的なアイテムセットを表示できます。 |
平均値 | このアイテムセット内のアイテムの価値合計をサポートで除算した値。 この列で並べ替えおよびフィルター処理を行い、さまざまな価格帯の製品を対象にすることができます。 |
買い物かごの平均値 | このアイテムセットを含む注文内にあるすべてのアイテムの価値合計をサポートで除算した値。 この統計は、アイテムセットの平均値と組み合わせて使用すると興味深い情報が得られます。 |
リフト | データ セット全体におけるこのアイテムセットの有意性を表すスコア。 リフトは、2 つのアイテムが同時に検出される確率を取得し、2 つのアイテムが個別に検出される確率で除算することによって計算されます。 結果として、アイテム間の相関関係が密接な場合、リフト スコアは高くなります。 |
買い物かごルール レポート
このレポートには、検出されたアイテムセットを分析することで作成された一連のルールが示されます。 たとえば、製品 A および B が併せて購入される頻度が高いことがトランザクション データからわかった場合は、A が検出されると B が存在する、または B が検出されると A が存在することを予測するルールが買い物かご分析ツールによって作成されます。
各ルールは、サポート データから得られる確率に関連付けられます。 このような確率は、特定のアイテムを提案する場合などに有用です。 たとえば、既存のデータに基づいて、50% 以上の精度の確率のルールのみを表示できます。
このレポートには、検出されたアイテムセットがリフト順に示されます。 リフトは、アイテムセットの重要度を示すスコアです。
レポート内の列 | 内容 |
---|---|
既存のアイテム | 提案を行うために必要なアイテムを一覧表示します。 データ マイニングでは、これらの項目は関連付けルールの 左側 にあると言われます。 |
予測されるアイテム | 提案するアイテムを一覧表示します。 データ マイニングでは、これらの項目は関連付けルールの 右側 にあると言われます。 |
確率 | このルールが正しいかどうかの確率を表示します。 |
サポート | このルールの根拠となる既存のデータ内のケースの数を示します。 |
ルールの価値 | 買い物かごのアイテムの価値を指定した場合は、この列で、アイテムのコストを前提とした予測の価値が計算されます。 |
リフト | 1 列目のアイテムと 2 列目のアイテム間の相関関係の強さを示します。 重要度とも呼ばれます。 リフトが 0 の場合、相関関係はありません。 正の値の場合は、1 列目のアイテムによって 2 列目のアイテムが予測されます。 数値が大きいほど相関関係が強くなります。 |
関連ツール
Excel 用のデータ マイニング クライアントは、より高度なデータ マイニング機能を備えた独立したアドインであり、アソシエーション分析を行うウィザードも用意されています。 詳細については、「 関連付けウィザード (データ マイニング クライアント for Excel)」を参照してください。
この分析を行うために使用されるアルゴリズムの詳細については、SQL Server オンライン ブックの「Microsoft アソシエーション アルゴリズム」を参照してください。