次の方法で共有


レッスン 4: Bike Buyer マイニング モデルの参照

このレッスンでは、 SELECT (DMX) ステートメントを使用して、「 レッスン 2: 予測マイニング構造へのマイニング モデルの追加」で作成したデシジョン ツリーとクラスタリング マイニング モデルのコンテンツを調べていきます。

マイニング モデルに含まれる列は、マイニング構造で定義されている列ではなく、アルゴリズムによって検出された傾向とパターンを記述している、特定の列のセットです。 これらのマイニング モデル列については、「 DMSCHEMA_MINING_MODEL_CONTENT行セット スキーマ行セット」を参照してください。 たとえば、コンテンツ スキーマ行セットの MODEL_NAME 列には、マイニング モデルの名前が含まれます。 クラスター マイニング モデルの場合、NODE_CAPTION 列には各クラスターの名前が含まれ、NODE_DESCRIPTION 列には各クラスターの特性の説明が含まれます。 SELECT FROM <モデル>を使用して、これらの列を参照できます。DMX の CONTENT ステートメント。 このステートメントを使用すると、マイニング モデルの作成に使用されたデータを調査することもできます。 このステートメントを使用するには、マイニング構造上でドリルスルーを有効にする必要があります。 ステートメントの詳細については、「 SELECT FROM <model>」を参照してください。ケース (DMX)

SELECT DISTINCT ステートメントを使用することにより、不連続列のすべての状態を返すこともできます。 たとえば、性別の列でこの操作を実行すると、クエリでは malefemale が返されます。

このレッスンの作業

このレッスンでは、次のタスクを実行します。

  • マイニング モデルに含まれる内容の調査

  • マイニング モデルのトレーニングに使用されたソース データからケースを返す

  • 特定の不連続列に対して可能な状態の調査

マイニング モデルの内容を返す

このレッスンでは、 SELECT FROM <モデルを使用します>。 クラスタリング モデルの内容を返す CONTENT (DMX) ステートメント。

SELECT FROM <モデル>の一般的な例を次に示します。CONTENT ステートメント:

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

コードの 1 行目では、マイニング モデルの内容から返す列と、それらの列が関連付けられているマイニング モデルを定義します。

SELECT <select list> FROM [<mining model].CONTENT  

マイニング モデル名の後の .CONTENT 句は、マイニング モデルから内容を返すことを示します。 マイニング モデルに含まれる列の詳細については、「 DMSCHEMA_MINING_MODEL_CONTENT行セット」を参照してください。

コードの最終行では、ステートメントで返される結果をフィルター選択します。この行は省略可能です。

WHERE <where clause>  

たとえば、クエリの結果を制限して、多数のケースが含まれるクラスターのみを返すようにする場合は、SELECT ステートメントに次の WHERE 句を追加します。

WHERE NODE_SUPPORT > 100  

WHERE ステートメントの使用方法の詳細については、「 SELECT (DMX)」を参照してください。

クラスター マイニング モデルの内容を返すには

  1. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが表示されます。

  2. SELECT FROM <モデルの一般的な例をコピーします>。空のクエリへの CONTENT ステートメント。

  3. 次の部分を探します。

    <select list>   
    

    次の内容に置き換えます。

    *  
    

    * を、 DMSCHEMA_MINING_MODEL_CONTENT行セットに含まれる列の一覧に置き換えることもできます。

  4. 次の部分を探します。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Clustering]  
    

    最終的なステートメントは次のようになります。

    SELECT * FROM [Clustering].CONTENT  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます SELECT_CONTENT.dmx

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    クエリが実行され、マイニング モデルの内容が返されます。

ドリルスルーの使用

次の手順では、ドリルスルー ステートメントを使用して、デシジョン ツリー マイニング モデルのトレーニングに使用されたケースの一部を返します。 このレッスンでは、 SELECT FROM <モデルを使用します>。デ シジョン ツリー モデルの内容を返す CASES (DMX) ステートメント。

SELECT FROM <モデル>の一般的な例を次に示します。CASES ステートメント:

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

コードの 1 行目では、ソース データから返す列と、それらの列が含まれるマイニング モデルを定義します。

SELECT <select list> FROM [<mining model>].CASES  

.CASES 句は、ドリルスルー クエリを実行することを示します。 ドリルスルーを使用するには、マイニング モデルの作成時にドリルスルーを有効にする必要があります。

コードの最終行では、ケースを要求するマイニング モデル内のノードを指定します。この行は省略可能です。

WHERE IsInNode('<node id>')  

ISInNode で WHERE ステートメントを使用する方法の詳細については、「 SELECT FROM <model>」を参照してください。ケース (DMX)

マイニング モデルのトレーニングに使用されたケースを返すには

  1. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが表示されます。

  2. SELECT FROM <モデルの一般的な例をコピーします>。空のクエリへの CASES ステートメント。

  3. 次の部分を探します。

    <select list>   
    

    次の内容に置き換えます。

    *  
    

    * は、ソース データ内に含まれる任意の列の一覧 ([Bike Buyer] など) に置き換えることもできます。

  4. 次の部分を探します。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Decision Tree]  
    

    最終的なステートメントは次のようになります。

    SELECT *   
    FROM [Decision Tree].CASES  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます SELECT_DRILLTHROUGH.dmx

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    クエリが実行され、デシジョン ツリー マイニング モデルのトレーニングに使用されたソース データが返されます。

マイニング モデルの不連続列の状態を返す

次の手順では、SELECT DISTINCT ステートメントを使用して、指定されたマイニング モデル列に対して可能な状態を返します。

SELECT DISTINCT ステートメントの汎用例を次に示します。

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

コードの 1 行目では、状態を返すマイニング モデル列を定義します。

SELECT DISTINCT [<column>]   

列のすべての状態を返すには、DISTINCT を含める必要があります。 DISTINCT を指定しない場合は、ステートメント全体が予測用のショートカットとなり、指定した列で最も可能性の高い状態が返されます。 詳細については、「SELECT (DMX)」を参照してください。

不連続列の状態を返すには

  1. オブジェクト エクスプローラーで Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

    クエリ エディターが開き、新しい空のクエリが表示されます。

  2. 上の SELECT Distinct ステートメントの汎用例を空のクエリにコピーします。

  3. 次の部分を探します。

    [<column,name>   
    

    次の内容に置き換えます。

    [Bike Buyer]  
    
  4. 次の部分を探します。

    [<mining model>]   
    

    次の内容に置き換えます。

    [Decision Tree]  
    

    最終的なステートメントは次のようになります。

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  5. [ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。

  6. [ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに という名前を付けます SELECT_DISCRETE.dmx

  7. ツール バーの [ 実行 ] ボタンをクリックします。

    クエリが実行され、Bike Buyer 列の可能な状態が返されます。

次のレッスンでは、デシジョン ツリー マイニング モデルを使用して、潜在顧客が自転車の購入者になるかどうかを予測します。

次のレッスン

レッスン 5: 予測クエリの実行