レッスン 1: Bike Buyer マイニング構造の作成

[アーティクル]
05/07/2013

このレッスンでは、Adventure Works Cycles の潜在顧客が自転車を購入するかどうかを予測するためのマイニング構造を作成します。マイニング構造と、データマイニングにおけるマイニング構造の役割については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

このレッスンで作成する Bike Buyer マイニング構造には、Microsoft クラスタリングアルゴリズムと Microsoft デシジョンツリーアルゴリズムに基づくマイニングモデルを追加できます。後のレッスンでは、クラスターマイニングモデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョンツリーマイニングモデルを使用して潜在顧客が自転車を購入するかどうかを予測します。

CREATE MINING STRUCTURE ステートメント

マイニング構造を作成するには、CREATE MINING STRUCTURE (DMX) ステートメントを使用します。ステートメントのコードは次の部分に分けられます。

構造の名前指定
キー列の定義
マイニング列の定義
省略可能なテストデータセットの定義

CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。

CREATE MINING STRUCTURE [<mining structure name>]
(
    <key column>,
    <mining structure columns>
) 
WITH HOLDOUT (<holdout specifier>)

コードの 1 行目では、構造の名前を定義します。

CREATE MINING STRUCTURE [<mining structure name>]

データマイニング拡張機能 (DMX) でオブジェクトに名前を付ける方法については、「識別子 (DMX)」を参照してください。

コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソースデータ内のエンティティを一意に識別します。

<key column>,

作成するマイニング構造では、顧客の識別子 CustomerKey でソースデータ内のエンティティが定義されます。

その次の行では、マイニング構造に関連付けられたマイニングモデルで使用される、マイニング列を定義します。

<mining structure columns>

<mining structure columns> 内で DISCRETIZE 関数を使用して、次の構文で連続列を分離できます。

DISCRETIZE(<method>,<number of buckets>)

列の分離の詳細については、「分離メソッド (データマイニング)」を参照してください。定義できるマイニング構造列の種類の詳細については、「マイニング構造列」を参照してください。

コードの最後の行では、マイニング構造の省略可能なパーティションを定義します。

WITH HOLDOUT (<holdout specifier>)

構造に関連するマイニングモデルのテストに使用するためにデータの一部を指定し、残りのデータはモデルのトレーニングに使用します。既定では、Analysis Services によって、全ケースデータの 30% から成るテストデータセットが作成されます。テストデータセットがケースの 30% になるように指定を追加します (最大 1000 ケース)。ケースの 30% が 1000 より小さい場合、テストデータセットの量はもっと少なくなります。

このレッスンの作業

このレッスンでは、次の作業を行います。

新しい空のクエリの作成
マイニング構造を作成するためのクエリの変更
クエリの実行

クエリの作成

最初の手順では、SQL Server Management Studio で、Analysis Services のインスタンスに接続して新しい DMX クエリを作成します。

SQL Server Management Studio で新しい DMX クエリを作成するには

SQL Server Management Studio を開きます。
[サーバーへの接続] ダイアログボックスで、[サーバーの種類] の [Analysis Services] を選択します。 [サーバー名] に、「LocalHost」と入力するか、このレッスンで接続する Analysis Services のインスタンスの名前を入力して、 [接続] をクリックします。
オブジェクトエクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして [DMX] をクリックすると、クエリエディターが開き、新しい空のクエリが表示されます。

クエリの変更

次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。

CREATE MINING STRUCTURE ステートメントをカスタマイズするには

クエリエディターで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。
次の部分を探します。
```
[<mining structure>] 
```
これを次の文字列に置き換えます。
```
[Bike Buyer]
```
次の部分を探します。
```
<key column> 
```
これを次の文字列に置き換えます。
```
CustomerKey LONG KEY
```

次の部分を探します。

<mining structure columns>

これを次の文字列に置き換えます。

   [Age] LONG DISCRETIZED(Automatic,10),
   [Bike Buyer] LONG DISCRETE,
   [Commute Distance] TEXT DISCRETE,
   [Education] TEXT DISCRETE,
   [Gender] TEXT DISCRETE,
   [House Owner Flag] TEXT DISCRETE,
   [Marital Status] TEXT DISCRETE,
   [Number Cars Owned] LONG DISCRETE,
   [Number Children At Home] LONG DISCRETE,
   [Occupation] TEXT DISCRETE,
   [Region] TEXT DISCRETE,
   [Total Children]LONG DISCRETE,
   [Yearly Income] DOUBLE CONTINUOUS

次の部分を探します。

WITH HOLDOUT (holdout specifier>)

これを次の文字列に置き換えます。

WITH HOLDOUT (30 PERCENT or 1000 CASES)

最終的なマイニング構造のステートメントは次のようになります。

CREATE MINING STRUCTURE [Bike Buyer]
(
   [Customer Key] LONG KEY,
   [Age]LONG DISCRETIZED(Automatic,10),
   [Bike Buyer] LONG DISCRETE,
   [Commute Distance] TEXT DISCRETE,
   [Education] TEXT DISCRETE,
   [Gender] TEXT DISCRETE,
   [House Owner Flag] TEXT DISCRETE,
   [Marital Status] TEXT DISCRETE,
   [Number Cars Owned]LONG DISCRETE,
   [Number Children At Home]LONG DISCRETE,
   [Occupation] TEXT DISCRETE,
   [Region] TEXT DISCRETE,
   [Total Children]LONG DISCRETE,
   [Yearly Income] DOUBLE CONTINUOUS
)
WITH HOLDOUT (30 PERCENT or 1000 CASES)

[ファイル] メニューで、[名前を付けて DMXQuery1.dmx を保存] をクリックします。
[名前を付けて保存] ダイアログボックスで、適切なフォルダーを参照して指定し、ファイルに「Bike Buyer Structure.dmx」という名前を付けます。

クエリの実行

最後の手順では、クエリを実行します。クエリを作成して保存したら、そのクエリを実行する必要があります。つまり、サーバーでマイニング構造を作成するには、ステートメントを実行する必要があります。クエリエディターでのクエリの実行の詳細については、「データベースエンジンクエリエディター (SQL Server Management Studio)」を参照してください。

クエリを実行するには

クエリエディターのツールバーで、[実行] をクリックします。

ステートメントの実行完了後、クエリエディター下部の [メッセージ] タブにクエリの状態が表示されます。この場合次のメッセージが表示されます。
```
Executing the query 
Execution complete
```
これで、Bike Buyer という名前の新しい構造が、サーバー上に作成されました。

次のレッスンでは、作成した構造にマイニングモデルを追加します。

次のレッスン

レッスン 2: Bike Buyer マイニング構造へのマイニングモデルの追加

次の方法で共有