次の方法で共有


Bike Buyer DMX のチュートリアル

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用して、マイニング モデルを作成、トレーニング、および調査する方法を学習します。 その後、これらのマイニング モデルを使用して、顧客が自転車を購入するかどうかを判断する予測を作成します。

マイニング モデルは、架空の会社 Adventure Works Cycles のデータを格納する AdventureWorksDW2012 サンプル データベースに含まれるデータから作成されます。 Adventure Works Cycles は、大規模で多国籍な製造会社です。 北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。 その基本業務はワシントン州ボセルにあり、従業員数は290人で、国際市場拠点全体に複数の地域営業チームがあります。

チュートリアルのシナリオ

Adventure Works Cycles では、データ マイニング機能を使用するカスタム アプリケーションを作成することで、データ分析を拡張することにしました。 このカスタム アプリケーションでは、次の機能を実現することを目標にします。

  • 潜在顧客の特性を入力し、潜在顧客が自転車を購入するかどうかを予測する。

  • 特性の他に潜在顧客の一覧も入力し、どの顧客が自転車を購入するかを予測する。

最初のケースでは、顧客データは顧客登録ページによって提供され、2 番目のケースでは、Adventure Works Cycles マーケティング部門によって潜在的な顧客の一覧が提供されます。

マーケティング部門には、さらに住所、子どもの数、通勤距離などの特性に基づいて既存の顧客を分類するという要求が出されています。 この分類を使用して、特定の種類の顧客に的を絞ることができるかどうか確認することが求められています。 これには、追加のマイニング モデルが必要です。

Microsoft SQL Server Analysis Services には、これらのタスクを実行するために使用できるいくつかのツールが用意されています。

データ マイニング拡張機能 (DMX) は、マイニング モデルの作成と操作に使用できる Analysis Services によって提供されるクエリ言語です。 Microsoft Decision Trees アルゴリズムは、だれかが自転車を購入するかどうかを予測するために使用できるモデルを作成します。 作成したモデルには、個別の顧客または複数の顧客のテーブルを入力できます。 Microsoft クラスタリング アルゴリズムでは、共有特性に基づいて顧客のグループ化を作成できます。 このチュートリアルの目標は、カスタム アプリケーションで使用する DMX スクリプトを設定することです。

詳細については、「 Data マイニング ソリューション」を参照してください。

マイニング構造とマイニング モデル

DMX ステートメントの作成を開始する前に、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。 マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義するデータ構造です。 1 つのマイニング構造には、同じドメインを共有する複数のマイニング モデルを含めることができます。 マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。 マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。 マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。 たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。 指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。 1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。 次の表でこれらの方法について説明します。

CREATE MINING MODEL
このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。 マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。 このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

詳細については、「 マイニング モデルの作成 (DMX)」を参照してください。

ALTER MINING STRUCTURE
このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。 このステートメントは、複数の異なるマイニング モデルを含むマイニング構造を作成する場合に便利です。 1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。 たとえば、異なるアルゴリズムを使用する複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。 また、同じアルゴリズムでそれぞれ異なるパラメーターを設定して複数のマイニング モデルを作成し、パラメーターの最適な設定を見つけ出すことができます。

詳細については、「 ALTER MINING STRUCTURE (DMX)」を参照してください。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細情報

データ マイニング拡張機能 (DMX) リファレンス DMX Select ステートメントの理解 DMX 予測クエリの構造と使用方法

学習する内容

このチュートリアルは次のレッスンで構成されています。

レッスン 1: Bike Buyer マイニング構造の作成
このレッスンでは、CREATE ステートメントを使用して、マイニング構造を作成する方法を学習します。

レッスン 2: Bike Buyer マイニング構造へのマイニング モデルの追加
このレッスンでは、ALTER ステートメントを使用して、マイニング モデルをマイニング構造に追加する方法を学習します。

レッスン 3: Bike Buyer マイニング構造の処理
このレッスンでは、INSERT INTO ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを処理する方法を学習します。

レッスン 4: Bike Buyer マイニング モデルの参照
このレッスンでは、SELECT ステートメントを使用してマイニング モデルの内容を調査する方法を学習します。

レッスン 5: 予測クエリの実行
このレッスンでは、PREDICTION JOIN ステートメントを使用して、マイニング モデルに対する予測を作成する方法を学習します。

要件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server

  • Microsoft SQL Server 2005 Analysis Services (SSAS)、SQL Server 2008 Analysis Services (SSAS)、SQL Server 2014 Analysis Services (SSAS)、または SQL Server Analysis Services

  • AdventureWorksDW2012 データベース。 セキュリティ強化のため、既定ではサンプル データベースがインストールされません。 Microsoft SQL Server の公式サンプル データベースをインストールするには、 Microsoft SQL サンプル データベース ページにアクセスし、インストールするデータベースを選択します。

Note

チュートリアルを確認するときは、 次のトピックPrevious トピック ボタンをドキュメント ビューアー ツール バーに追加することをお勧めします。

参照

マーケット バスケット DMX のチュートリアル
基本的なデータ マイニング チュートリアル