次の方法で共有


マーケット バスケット DMX のチュートリアル

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用してマイニング モデルを作成、トレーニング、探索する方法について説明します。 その後、このマイニング モデルを使用して、同時に購入される傾向が高い製品を示す予測を作成します。

マイニング モデルは、架空の会社 Adventure Works Cycles のデータを格納する AdventureWorksDW2012 サンプル データベースに含まれるデータから作成されます。 Adventure Works Cycles は、大規模で多国籍な製造会社です。 北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。 企業の拠点は従業員 290 人を擁する米国ワシントン州ボセルで、また各国の市場の拠点として、複数の地域販売チームが配置されています。

チュートリアルのシナリオ

Adventure Works Cycles では、データ マイニング機能を使用して、顧客が同時に購入する傾向がある製品の種類を予測するカスタム アプリケーションを作成することにしました。 このカスタム アプリケーションの目標は、一連の製品を指定できるようにし、指定した製品と共に購入される追加製品を予測できるようにすることです。 Adventure Works Cycles では、この情報を使用して Web サイトに "提案" 機能を追加し、顧客に情報を提示する方法をより適切に整理します。

Microsoft SQL Server Analysis Services には、このタスクを実行するために使用できるいくつかのツールが用意されています。

データ マイニング拡張機能 (DMX) は、マイニング モデルの作成と操作に使用できる Analysis Services によって提供されるクエリ言語です。 Microsoft アソシエーション アルゴリズムは、一緒に購入される可能性が高い製品を予測できるモデルを作成します。

このチュートリアルの目標は、カスタム アプリケーションで使用する DMX クエリを設定することです。

詳細については、「 Data マイニング ソリューション」を参照してください。

マイニング構造とマイニング モデル

DMX ステートメントの作成を開始する前に、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。 マイニング構造は、マイニング モデルの構築元となるデータ ドメインを定義するデータ構造です。 1 つのマイニング構造に、同じドメインを共有する複数の マイニング モデル を含めることができます。 マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。 マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。 マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。 たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。 指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。 1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。 これらの方法について以下に詳しく説明します。

CREATE MINING MODEL
このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。 マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。

このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

詳細については、「 マイニング モデルの作成 (DMX)」を参照してください。

CREATE MINING STRUCTURE
新しいマイニング構造をモデルなしで作成するには、このステートメントを使用します。

CREATE MINING STRUCTURE を使用すると、予約データ セットも作成できます。予約データ セットは、同一のマイニング構造に基づくすべてのモデルをテストするために使用できます。

詳細については、「 マイニング構造 (DMX) を作成する」を参照してください。

ALTER MINING STRUCTURE
このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。

1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。 たとえば、異なるアルゴリズムを使用して複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。 また、同じアルゴリズムを使用して複数のマイニング モデルを作成することもできますが、パラメーターをマイニング モデルごとに異なる方法で設定して、そのパラメーターに最適な設定を見つけることができます。

詳細については、「 ALTER MINING STRUCTURE (DMX)」を参照してください。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細情報

データ マイニング拡張機能 (DMX) リファレンス DMX Select ステートメントの理解 DMX 予測クエリの構造と使用方法

学習する内容

このチュートリアルは次のレッスンで構成されています。

レッスン 1: Market Basket マイニング構造の作成
このレッスンでは、CREATE ステートメントを使用して、マイニング構造を作成する方法を学習します。

レッスン 2: Market Basket マイニング構造へのマイニング モデルの追加
このレッスンでは、ALTER ステートメントを使用して、マイニング モデルをマイニング構造に追加する方法を学習します。

レッスン 3: Market Basket マイニング構造の処理
このレッスンでは、 INSERT INTO ステートメントを使用して、マイニング構造とそれに関連付けられているマイニング モデルを処理する方法について説明します。

レッスン 4: マーケット バスケット予測の実行
このレッスンでは、PREDICTION JOIN ステートメントを使用して、マイニング モデルに対する予測を作成する方法を学習します。

要件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server

  • Microsoft SQL Server Analysis Services

  • AdventureWorksDW2012 データベース

セキュリティ強化のため、既定ではサンプル データベースがインストールされません。 Microsoft SQL Server の公式サンプル データベースをインストールするには、 https://www.CodePlex.com/MSFTDBProdSamples に移動するか、Microsoft SQL Server 製品サンプルセクションの Microsoft SQL Server サンプルとコミュニティ プロジェクトのホーム ページに移動します。 [ Databases] をクリックし、[ Releases ] タブをクリックし、目的のデータベースを選択します。

Note

チュートリアルを確認するときは、 次のトピックPrevious トピック ボタンをドキュメント ビューアー ツール バーに追加することをお勧めします。

参照

Bike Buyer DMX のチュートリアル
基本的なデータ マイニング チュートリアル
レッスン 3: マーケット バスケット シナリオの構築 (中間データ マイニング チュートリアル)