次の方法で共有


レッスン 5: 予測クエリの実行

このレッスンでは、SELECT ステートメントの SELECT FROM <モデル> PREDICTION JOIN (DMX) フォームを使用して、「 レッスン 2: 関連付けマイニング構造へのマイニング モデルの追加」で作成したデシジョン ツリー モデルに基づいて、2 種類の予測を作成します。 作成する予測の種類は次のとおりです。

シングルトン クエリ
予測を行う際にアドホック値を提供するには、単一クエリを使用します。 たとえば、顧客の通勤距離、市外局番、または子供の数などをクエリに入力して、1 人の顧客が自転車を購入するかどうかを判断できます。 単一クエリは、これらの入力に基づいてこの顧客が自転車を購入する可能性を示す値を返します。

バッチ クエリ
複数の潜在顧客が含まれるテーブルの中から、自転車を購入する可能性がある人物を特定するには、バッチ クエリを使用します。 たとえば、マーケティング部門から顧客と顧客の属性の一覧が提供された場合、バッチ予測を使用して、テーブルの中で自転車を購入する可能性が高い人物を特定できます。

SELECT ステートメントの SELECT FROM <モデル> PREDICTION JOIN (DMX) 形式には、次の 3 つの部分が含まれています。

  • 結果で返される、マイニング モデル列と予測関数の一覧。 結果にはソース データからの入力列を含めることもできます。

  • 予測の作成に使用するデータを定義しているソース クエリ。 たとえば、バッチ クエリの場合は顧客の一覧などが該当します。

  • マイニング モデル列とソース データ間のマッピング。 これらの名前が同じ場合は、NATURAL 構文を使用して列マッピングを省略できます。

予測関数を使用すると、さらにクエリを改良できます。 予測関数では、予測が発生する可能性など追加の情報と、トレーニング データセットでの予測サポートが提供されます。 予測関数の詳細については、「 関数 (DMX)」を参照してください。

このチュートリアルの予測は、 AdventureWorksDW2012 サンプル データベースの ProspectiveBuyer テーブルに基づいています。 ProspectiveBuyer テーブルには、潜在顧客と、それらの顧客に関連付けられている特性の一覧が格納されています。 このテーブルに格納されている顧客は、デシジョン ツリー マイニング モデルの作成で使用した顧客とは異なります。

SQL Server Data Tools (SSDT) で予測クエリ ビルダーを使用して予測を作成することもできます。

このレッスンの作業

このレッスンでは、次のタスクを実行します。

  • 特定の顧客が自転車を購入するかどうかを特定する単一クエリを作成します。

  • 複数の顧客が含まれるテーブルの中から、自転車を購入する可能性がある顧客を特定するバッチ クエリを作成します。

シングルトン クエリ

最初の手順では、シングルトン予測クエリで SELECT FROM <モデル> PREDICTION JOIN (DMX) を使用します。 単一ステートメントの汎用例を次に示します。

SELECT <select list> FROM [<mining model name>]   
NATURAL PREDICTION JOIN  
(SELECT '<value>' AS [<column>], ...)  
AS [<input alias>]  

コードの最初の行では、クエリで返されるマイニング モデルの列を定義し、予測の生成に使用するマイニング モデルを指定します。

SELECT <select list> FROM [<mining model name>]   

コードの次の行では、予測の作成に使用する顧客の特性を定義します。

NATURAL PREDICTION JOIN  
(SELECT '<value>' AS [<column>], ...)  
AS [<input alias>]  
ORDER BY <expression>  

NATURAL PREDICTION JOIN を指定した場合、サーバーでは、モデルの各列と入力された列が列名に基づいて照合されます。 列名が一致しない場合は無視されます。

単一予測クエリを作成するには

  1. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが表示されます。

  2. 上の単一ステートメントの汎用例を空のクエリにコピーします。

  3. 次の部分を探します。

    <select list>   
    

    次の内容に置き換えます。

    [Bike Buyer] AS Buyer, PredictHistogram([Bike Buyer]) AS Statistics  
    

    AS ステートメントは、クエリで返される列に別名を付けるために使用します。 PredictHistogram 関数は、確率とサポートを含む予測に関する統計を返します。 予測ステートメントで使用できる関数の詳細については、「 Functions (DMX)」を参照してください。

  4. 次の部分を探します。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Decision Tree]  
    
  5. 次の部分を探します。

    (SELECT '<value>' AS [<column name>], ...)  AS t  
    

    次の内容に置き換えます。

    (SELECT 35 AS [Age],  
      '5-10 Miles' AS [Commute Distance],  
      '1' AS [House Owner Flag],  
      2 AS [Number Cars Owned],  
      2 AS [Total Children]) AS t  
    

    最終的なステートメントは次のようになります。

    SELECT  
       [Bike Buyer] AS Buyer,  
       PredictHistogram([Bike Buyer]) AS Statistics  
    FROM  
       [Decision Tree]  
    NATURAL PREDICTION JOIN  
    (SELECT 35 AS [Age],  
       '5-10 Miles' AS [Commute Distance],  
       '1' AS [House Owner Flag],  
       2 AS [Number Cars Owned],  
       2 AS [Total Children]) AS t  
    
  6. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  7. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます Singleton_Query.dmx

  8. ツール バーの [ 実行 ] ボタンをクリックします。

    クエリが実行され、指定した特性の顧客が自転車を購入するかどうかの予測と、予測に関する統計が返されます。

バッチ クエリ

次の手順では、バッチ予測クエリで SELECT FROM <モデル> PREDICTION JOIN (DMX) を使用します。 バッチ ステートメントの汎用例を次に示します。

SELECT TOP <number> <select list>   
FROM [<mining model name>]  
PREDICTION JOIN  
OPENQUERY([<datasource>],'<SELECT statement>')  
  AS [<input alias>]  
ON <on clause, mapping,>  
WHERE <where clause, boolean expression,>  
ORDER BY <expression>  

単一クエリと同様に、コードの最初の 2 行では、クエリで返されるマイニング モデルの列と、予測の生成に使用するマイニング モデルの名前を定義します。 TOP <number> ステートメントは、クエリが number または number> で<指定された結果のみを返すように指定します。

コードの次の数行では、予測の基になるソース データを定義します。

OPENQUERY([<datasource>],'<SELECT statement>')  
  AS [<input alias>]  

ソース データを取得するにはいくつかの方法がありますが、このチュートリアルでは OPENQUERY を使用します。 使用できるオプションの詳細については、「ソース データ クエリ>」を参照してください<

次の行では、マイニング モデルのソース列とソース データの列間のマッピングを定義します。

ON <column mappings>  

WHERE 句は、予測クエリで返される結果をフィルター処理します。

WHERE <where clause, boolean expression,>  

コードの最後の省略可能な行では、結果の列の順序を指定します。

ORDER BY <expression> [DESC|ASC]  

ORDER BY を TOP <number> ステートメントと組み合わせて使用して、返される結果をフィルター処理します。 たとえば、今回の予測では上位 10 人の自転車購入者が返され、結果は予測の精度が高い順序で並べ替えられます。 [DESC|ASC] 構文を使用すると、結果を表示する順序を制御できます。

バッチ予測クエリを作成するには

  1. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが表示されます。

  2. 上のバッチ ステートメントの汎用例を空のクエリにコピーします。

  3. 次の部分を探します。

    <select list>   
    

    次の内容に置き換えます。

    SELECT  
      TOP 10  
      t.[LastName],  
      t.[FirstName],  
      [Decision Tree].[Bike Buyer],  
      PredictProbability([Bike Buyer])  
    

    TOP 10 句を指定すると、クエリによって上位 10 個の結果だけが返されます。 このクエリの ORDER BY ステートメントでは、予測の精度が高い順序で結果が並べ替えられ、可能性が高い上位 10 件の結果だけが返されます。

  4. 次のプレースホルダーを置換します。

    [<mining model>]   
    

    置換後はモデルの名前になります。

    [Decision Tree]  
    
  5. 次の一般的な OPENQUERY ステートメントを置き換えます。

    OPENQUERY([<datasource>],'<SELECT statement>')  
    

    置換後は、AdventureWork の現在のデータ ウェアハウスを参照するステートメントであり、次のようになります。

    OPENQUERY([Adventure Works DW 2014],  
      'SELECT  
        [LastName],  
        [FirstName],  
        [MaritalStatus],  
        [Gender],  
        [YearlyIncome],  
        [TotalChildren],  
        [NumberChildrenAtHome],  
        [Education],  
        [Occupation],  
        [HouseOwnerFlag],  
        [NumberCarsOwned]  
      FROM  
        [dbo].[ProspectiveBuyer]  
      ') AS t  
    
  6. 次の一般的な構文を置換します。

    <ON clause, mapping,>   
    WHERE <where clause, boolean expression,>  
    ORDER BY <expression>  
    

    置換後は、このモデルと入力データ セットで必要とされる列のマッピングになります。

    [Decision Tree].[Marital Status] = t.[MaritalStatus] AND  
      [Decision Tree].[Gender] = t.[Gender] AND  
      [Decision Tree].[Yearly Income] = t.[YearlyIncome] AND  
      [Decision Tree].[Total Children] = t.[TotalChildren] AND  
      [Decision Tree].[Number Children At Home] = t.[NumberChildrenAtHome] AND  
      [Decision Tree].[Education] = t.[Education] AND  
      [Decision Tree].[Occupation] = t.[Occupation] AND  
      [Decision Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND  
      [Decision Tree].[Number Cars Owned] = t.[NumberCarsOwned]  
    WHERE [Decision Tree].[Bike Buyer] =1  
    ORDER BY PredictProbability([Bike Buyer]) DESC  
    

    可能性の高い順に結果が一覧されるように、DESC を指定します。

    最終的なステートメントは次のようになります。

    SELECT  
      TOP 10  
      t.[LastName],  
      t.[FirstName],  
      [Decision Tree].[Bike Buyer],  
      PredictProbability([Bike Buyer])  
    FROM  
      [Decision Tree]  
    PREDICTION JOIN  
      OPENQUERY([Adventure Works DW 2014],  
        'SELECT  
          [LastName],  
          [FirstName],  
          [MaritalStatus],  
          [Gender],  
          [YearlyIncome],  
          [TotalChildren],  
          [NumberChildrenAtHome],  
          [Education],  
          [Occupation],  
          [HouseOwnerFlag],  
          [NumberCarsOwned]  
        FROM  
          [dbo].[ProspectiveBuyer]  
        ') AS t  
    ON  
      [Decision Tree].[Marital Status] = t.[MaritalStatus] AND  
      [Decision Tree].[Gender] = t.[Gender] AND  
      [Decision Tree].[Yearly Income] = t.[YearlyIncome] AND  
      [Decision Tree].[Total Children] = t.[TotalChildren] AND  
      [Decision Tree].[Number Children At Home] = t.[NumberChildrenAtHome] AND  
      [Decision Tree].[Education] = t.[Education] AND  
      [Decision Tree].[Occupation] = t.[Occupation] AND  
      [Decision Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND  
      [Decision Tree].[Number Cars Owned] = t.[NumberCarsOwned]  
    WHERE [Decision Tree].[Bike Buyer] =1  
    ORDER BY PredictProbability([Bike Buyer]) DESC  
    
  7. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  8. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます Batch_Prediction.dmx

  9. ツール バーの [ 実行 ] ボタンをクリックします。

    クエリが実行され、顧客名、各顧客が自転車を購入するかどうかの予測、予測の精度を含むテーブルが返されます。

以上で Bike Buyer チュートリアルは終了です。 これで、顧客の類似性を特定し、潜在顧客が自転車を購入するかどうかを予測するために使用できるマイニング モデルのセットが完成しました。

マーケット バスケット シナリオで DMX を使用する方法については、「 Market Basket DMX チュートリアル」を参照してください。