共用方式為


建立預測 (基本資料採礦教學課程)

在您測試採礦模型的精確度並決定您滿意結果之後,就可以在 [資料採礦Designer的 [採礦模型預測] 索引標籤上使用 [預測查詢產生器] 來產生預測。

預測查詢產生器有三個檢視。 使用 [設計 ] 和 [ 查詢 ] 檢視,您可以建置並檢查查詢。 然後,您可以在 [ 結果 ] 檢視中執行查詢並檢視結果。

所有的預測查詢都是使用 DMX,也就是資料採礦延伸模組 (DMX) 語言的縮寫。 DMX 的語法與 T-SQL 的語法相似,但用於對資料採礦物件的查詢。 雖然 DMX 語法並不複雜,但使用類似這樣的查詢產生器,或office SQL Server資料採礦Add-Ins中的查詢產生器,可讓您更輕鬆地選取輸入和建置運算式,因此強烈建議您瞭解基本概念。

建立查詢

建立預測查詢的第一個步驟是,選取採礦模型和輸入資料表。

若要選取模型和輸入資料表

  1. 在 [資料採礦Designer的[採礦模型預測] 索引標籤上,按一下 [採礦模型] 方塊中的 [選取模型]。

  2. 在 [ 選取採礦模型 ] 對話方塊中,流覽樹狀結構至 [目標郵件 ] 結構,展開結構,選取 TM_Decision_Tree ,然後按一下 [ 確定]。

  3. 在 [ 選取輸入資料表 (s) ] 方塊中,按一下 [ 選取案例資料表]。

  4. 在 [ 選取資料表 ] 對話方塊的 [ 資料來源 ] 清單中,選取資料來源檢視 Adventure Works DW 多維度 2012。

  5. [資料表/檢視名稱] 中,選取 [潛在購買者] (dbo) 資料表,然後按一下 [ 確定]。

    資料表 ProspectiveBuyer 最類似 vTargetMail 案例資料表。

對應資料行

選好輸入資料表之後,「預測查詢產生器」會根據資料行的名稱,在採礦模型和輸入資料表之間建立預設的對應。 此結構中至少必須有一個資料行符合外部資料中的資料行。

重要

您用來判斷模型精確度的資料必須包含可對應至可預測資料行的資料行。 如果這類資料行不存在,您可以建立包含空值的資料行,但是其資料類型必須與預測的資料行相同。

將輸入對應至模型

  1. 以滑鼠右鍵按一下 [ 採礦模型 ] 視窗連接到 [ 選取輸入資料表 ] 視窗的行,然後選取 [ 修改連接]。

    請注意,並非每一個資料行都會對應。 我們將新增數個 資料表資料行的對應。 另外還會依據目前的日期資料行產生新的生日資料行,讓資料行更好比對。

  2. [資料表資料行]底下,按一下儲存格, Bike Buyer 然後從下拉式清單中選取 [預期][Buyer.Unknown]。

    這會將可預測的資料行 [Bike Buyer] 對應到輸入資料表資料行。

  3. 按一下 [確定] 。

  4. 方案總管中,以滑鼠右鍵按一下[目標郵件] 資料來源檢視,然後選取 [檢視Designer]。

  5. 以滑鼠右鍵按一下資料表[潛在預算],然後選取 [ 新增具名計算]。

  6. 在 [ 建立具名計算 ] 對話方塊中,針對 [資料 行名稱] 輸入 calcAge

  7. 針對 [描述],輸入 [根據生日計算年齡]。

  8. 在 [ 運算式 ] 方塊中,輸入 DATEDIFF(YYYY,[BirthDate],getdate()) ,然後按一下 [ 確定]。

    因為輸入資料表沒有對應至模型中的 Age 資料行,所以您可以使用這個運算式,從輸入資料表的 BirthDate 資料行計算客戶年齡。 由於 Age 識別為預測自行車購買最具影響力的資料行,因此它必須同時存在於模型和輸入資料表中。

  9. 在 [資料採礦] Designer中,選取 [採礦模型預測] 索引標籤,然後重新開啟 [修改連接] 視窗。

  10. [資料表資料行]底下,按一下 [年齡] 儲存格,然後從下拉式清單中選取 [ProspectiveBuyer.calcAge]。

    警告

    如果您未在清單中看見資料行,可能必須重新整理設計師中所載入資料來源檢視的定義。 若要這樣做,請從 [ 檔案 ] 功能表中選取 [ 全部儲存],然後在設計工具中關閉並重新開啟專案。

  11. 按一下 [確定] 。

設計預測查詢

  1. [採礦模型預測] 索引標籤工具列上的第一個按鈕是[切換至設計檢視]/[切換至結果檢視]/[切換至查詢檢視]按鈕。 按一下此按鈕上的向下箭號,然後選取 [ 設計]。

  2. 在 [ 採礦模型預測 ] 索引標籤的方格中,按一下 [來源 ] 資料行中第一個空白資料列中的儲存格,然後選取 [預測函數]。

  3. [預測函數] 資料列的 [ 欄位] 資料 行中,選取 PredictProbability

    在相同資料列的 [別名] 資料行中,輸入 結果的機率

  4. 從上方的 [採礦模型 ] 視窗中,選取 [Bike Buyer] 並將其拖曳至 [Criteria/Argument ] 儲存格。

    當您放開時,[TM_Decision_Tree]。[Bike Buyer] 會出現在 Criteria/Argument 儲存格中。

    這會指定 PredictProbability 函數的目的地資料行。 如需函式的詳細資訊,請參閱 資料採礦延伸模組 (DMX) 函數參考

  5. 按一下 [來源] 資料行中的下一個空白資料列,然後選取 [TM_Decision_Tree 採礦模型]。

  6. 在資料 TM_Decision_Tree 列中的 [ 欄位] 資料 行中,選取 Bike Buyer

  7. 在資料 TM_Decision_Tree 列中的 [Criteria/Argument ] 資料行中,輸入 =1

  8. 按一下 [來源] 資料行中的下一個空白資料列,然後選取 [潛在][購買者] 資料表

  9. 在資料 ProspectiveBuyer 列的 [ 欄位] 資料 行中,選取 [潛在][BuyerKey]。

    這會在預測查詢中加入唯一識別碼,供您辨識可能會購買和可能不會購買自行車的人。

  10. 將其他五個資料列加入至方格中。 針對每個資料列,選取 [潛在Buyer] 資料表 作為 [來源 ],然後在 [欄位 ] 資料格中新增下列資料行:

    • calcAge

    • 姓氏

    • 名字

    • AddressLine1

    • AddressLine2

最後,執行此查詢並瀏覽結果。

預測查詢產生器也包含下列控制項:

  • 顯示 核取方塊

    讓您可以移除查詢中的子句,而不必從設計師將其刪除。 當您使用複雜的查詢而想要保留語法時,這樣就不必複製 DMX 再貼入視窗,所以相當實用。

  • 群組

    在所選該行的開頭插入左括號,或在目前該行的結尾插入右括號。

  • AND/OR

    AND 目前函式或 OR 資料行之後立即插入運算子或運算子。

若要執行查詢並檢視結果

  1. 在 [ 採礦模型預測] 索引標籤中,選取 [ 結果] 按鈕。

  2. 當執行此查詢並顯示結果之後,您可以檢閱結果。

    [ 採礦模型預測 ] 索引標籤會顯示可能成為自行車購買者的潛在客戶連絡資訊。 結果資料行的 [機率] 表示預測的機率正確。 您可以利用這些結果來判斷哪些潛在的客戶應該成為郵寄目標。

  3. 此時,您可以儲存結果。 您有三個選項:

    • 以滑鼠右鍵按一下結果中的資料列,然後選取 [ 複製 ] 以只儲存該值 (,並將資料行標題) 至剪貼簿。

    • 以滑鼠右鍵按一下結果中的任何資料列,然後選取 [ 全部複製] ,將整個結果集,包括資料行標題複製到剪貼簿。

    • 按一下 [ 儲存查詢結果 ],將結果直接儲存至資料庫,如下所示:

      1. 在 [ 儲存資料採礦查詢結果] 對話方塊中,選取資料來源或定義新的資料來源。

      2. 輸入將包含查詢結果之資料表的名稱。

      3. 使用 [新增至 DSV] 選項來建立資料表,並將其新增至現有的資料來源檢視。 如果您想要保留模型的所有相關資料表,例如定型資料、預測來源資料,以及在相同的資料來源檢視中查詢結果,這會很有用。

      4. 使用 [ 如果存在] 選項覆寫,即可以最新的結果更新現有的資料表。

        如果您已將任何資料行加入至預測查詢、變更預測查詢中任何資料行的名稱或資料類型,或者已針對目的地資料表執行任何 ALTER 陳述式,就必須使用此選項來覆寫資料表。

        此外,例如,如果多個資料行具有相同的名稱 (,則預設資料行名稱Expression) 您必須為具有重複名稱的資料行建立別名,或當設計工具嘗試將結果儲存至SQL Server時,就會引發錯誤。 原因是 SQL Server 不允許多個資料行具有相同的名稱。

        如需詳細資訊,請參閱儲存 資料採礦查詢結果對話方塊 (採礦模型預測檢視)

本課程的下一項工作

在結構資料上使用鑽研 (基本資料採礦教學課程)

另請參閱

使用預測查詢產生器來建立預測查詢