次の方法で共有


レッスン 1: Bike Buyer マイニング構造の作成

このレッスンでは、Adventure Works Cycles の潜在的な顧客が自転車を購入するかどうかを予測できるマイニング構造を作成します。 マイニング構造とデータ マイニングでのそれらの役割に慣れていない場合は、「 マイニング構造 (Analysis Services - データ マイニング)」を参照してください。

このレッスンで作成する Bike Buyer マイニング構造では、 Microsoft クラスタリング アルゴリズム Microsoftデシジョン ツリー アルゴリズムに基づくマイニング モデルの追加がサポートされています。 後のレッスンでは、クラスター マイニング モデルを使用して顧客をグループ化するさまざまな方法を確認し、デシジョン ツリー マイニング モデルを使用して潜在顧客が自転車を購入するかどうかを予測します。

CREATE MINING STRUCTURE ステートメント

マイニング構造を作成するには、 CREATE MINING STRUCTURE (DMX) ステートメントを使用します。 ステートメントのコードは、次の部分に分けることができます。

  • 構造体に名前を付ける。

  • キー列の定義。

  • マイニング列の定義

  • 省略可能なテスト データセットの定義

CREATE MINING STRUCTURE ステートメントの汎用例を次に示します。

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

コードの 1 行目では、構造の名前を定義します。

CREATE MINING STRUCTURE [<mining structure name>]  

データ マイニング拡張機能 (DMX) でのオブジェクトの名前付けの詳細については、「 識別子 (DMX)」を参照してください。

コードの次の行では、マイニング構造のキー列を定義します。キー列は、ソース データ内のエンティティを一意に識別します。

<key column>,  

作成するマイニング構造では、顧客の識別子 CustomerKey でソース データ内のエンティティが定義されます。

その次の行では、マイニング構造に関連付けられたマイニング モデルで使用される、マイニング列を定義します。

<mining structure columns>  

マイニング構造列>内<で DISCRETIZE 関数を使用すると、次の構文を使用して連続列を分離できます。

DISCRETIZE(<method>,<number of buckets>)

列の分離の詳細については、「 分離メソッド (データ マイニング)」を参照してください。 定義できるマイニング構造列の種類の詳細については、「 マイニング構造列」を参照してください。

コードの最後の行では、マイニング構造の省略可能なパーティションを定義します。

WITH HOLDOUT (<holdout specifier>)  

構造に関連するマイニング モデルのテストに使用するためにデータの一部を指定し、残りのデータはモデルのトレーニングに使用します。 既定では、Analysis Services は、すべてのケース データの 30% を含むテスト データ セットを作成します。 テスト データセットがケースの 30% になるように指定を追加します (最大 1000 ケース)。 ケースの 30% が 1000 より小さい場合、テスト データセットの量はもっと少なくなります。

このレッスンの作業

このレッスンでは、次のタスクを実行します。

  • 新しい空のクエリを作成します。

  • クエリを変更してマイニング構造を作成します。

  • クエリを実行します。

クエリの作成

最初の手順では、Analysis Services のインスタンスに接続し、SQL Server Management Studioで新しい DMX クエリを作成します。

SQL Server Management Studio で新しい DMX クエリを作成するには

  1. SQL Server Management Studio を開きます。

  2. [ サーバーへの接続 ] ダイアログ ボックスの [ サーバーの種類] で、[ Analysis Services] を選択します。 [ サーバー名] に、「」と入力 LocalHostするか、このレッスンに接続する Analysis Services のインスタンスの名前を入力します。 [Connect] をクリックします。

  3. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントし、[DMX] をクリックしてクエリ エディターと新しい空のクエリを開きます。

クエリの変更

次の手順では、上の CREATE MINING STRUCTURE ステートメントを変更し、Bike Buyer マイニング構造を作成します。

CREATE MINING STRUCTURE ステートメントをカスタマイズするには

  1. クエリ エディターで、CREATE MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。

  2. 次の部分を探します。

    [<mining structure>]   
    

    次の内容に置き換えます。

    [Bike Buyer]  
    
  3. 次の部分を探します。

    <key column>   
    

    次の内容に置き換えます。

    CustomerKey LONG KEY  
    
  4. 次の部分を探します。

    <mining structure columns>   
    

    次の内容に置き換えます。

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. 次の部分を探します。

    WITH HOLDOUT (holdout specifier>)  
    

    次の内容に置き換えます。

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    最終的なマイニング構造のステートメントは次のようになります。

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
    
  6. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  7. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます Bike Buyer Structure.dmx

クエリの実行

最後の手順では、クエリを実行します。 クエリを作成して保存したら、そのクエリを実行する必要があります。 つまり、サーバーでマイニング構造を作成するには、ステートメントを実行する必要があります。 クエリ エディターでのクエリの実行の詳細については、「データベース エンジンのクエリ エディター (SQL Server Management Studio)」を参照してください。

クエリを実行するには

  1. クエリ エディターで、ツール バーの [実行] をクリックします。

    クエリの状態は、ステートメントの実行が完了した後、クエリ エディターの下部にある [メッセージ] タブに表示されます。 この場合次のメッセージが表示されます。

    Executing the query   
    Execution complete  
    

    Bike Buyer という名前の新しい構造がサーバーに存在するようになりました。

次のレッスンでは、作成した構造にマイニング モデルを追加します。

次のレッスン

レッスン 2: Bike Buyer マイニング構造へのマイニング モデルの追加