建立預測 (基本資料採礦教學課程)
測試好採礦模型的精確度,確定它們能符合您的要求之後,您可以在資料採礦設計師的 [採礦模型預測] 索引標籤中,利用「預測查詢產生器」來建立預測查詢。 這個介面可幫助您使用 DMX (或稱資料採礦延伸模組 (DMX) 語言) 建立查詢。 DMX 的語法與 T-SQL 的語法相似,但用於對資料採礦物件的查詢。
預測查詢產生器有三個檢視。 您可以利用 [設計] 和 [查詢] 檢視來建立和檢查您的查詢。 之後,您便可以在 [結果] 檢視中執行查詢和檢視結果。
如需有關如何使用「預測查詢產生器」的詳細資訊,請參閱<資料採礦查詢介面>。
建立查詢
建立預測查詢的第一個步驟是,選取採礦模型和輸入資料表。
若要選取模型和輸入資料表
在資料採礦設計師的 [採礦模型預測] 索引標籤的 [採礦模型] 方塊中,按一下 [選取模型]。
在 [選取採礦模型] 對話方塊中,於樹狀結構內導覽至 [目標郵寄] 結構,並展開此結構,然後選取 TM_Decision_Tree,再按一下 [確定]。
在 [選取輸入資料表] 方塊中,按一下 [選取案例資料表]。
在 [選取資料表] 對話方塊的 [資料來源] 清單中,選取 Adventure Works DW Multidimensional 2012 。
在 [資料表/檢視表名稱] 中,選取 [ProspectiveBuyer (dbo)] 資料表,再按一下 [確定]。
[ProspectiveBuyer] 資料表與 [vTargetMail] 案例資料表最為相似。
對應資料行
選好輸入資料表之後,「預測查詢產生器」會根據資料行的名稱,在採礦模型和輸入資料表之間建立預設的對應。 此結構中至少必須有一個資料行符合外部資料中的資料行。
![]() |
---|
您用來判斷模型精確度的資料必須包含可對應至可預測資料行的資料行。 如果這類資料行不存在,您可以建立包含空值的資料行,但是其資料類型必須與預測的資料行相同。 |
若要將結構資料行對應至輸入資料表資料行
以滑鼠右鍵按一下連接 [採礦模型] 視窗與 [選取輸入資料表] 視窗的線條,然後選取 [修改連接]。
請注意,並非每一個資料行都會對應。 我們將會加入數個 [資料表資料行] 的對應。 另外還會依據目前的日期資料行產生新的生日資料行,讓資料行更好比對。
在 [資料表資料行] 底下,按一下 [Bike Buyer] 資料格,並從下拉式清單中選取 [ProspectiveBuyer.Unknown]。
這會將可預測的資料行 [Bike Buyer] 對應到輸入資料表資料行。
按一下 [確定]。
在 [方案總管] 中,以滑鼠右鍵按一下 [目標郵寄] 資料來源檢視,並選取 [檢視表設計工具]。
以滑鼠右鍵按一下 [ProspectiveBuyer] 資料表,並選取 [新增具名計算]。
在 [建立具名計算] 對話方塊中,輸入 calcAge 做為 [資料行名稱]。
針對 [描述],輸入「依據生日計算年齡」。
在 [運算式] 方塊中輸入 DATEDIFF(YYYY,[BirthDate],getdate()),然後按一下 [確定]。
由於輸入資料表中沒有對應至模式中 [Age] 資料行的同一資料行,因此您可以使用此運算式從輸入資料表中的 BirthDate 資料行計算客戶年齡。 由於 [Age] 已被識別為用來預測自行車購買能力的最具影響力資料行,所以它必須同時存在於模型和輸入資料表中。
在資料採礦設計師中,選取 [採礦模型預測] 索引標籤,然後重新開啟 [修改連接] 視窗。
在 [資料表資料行] 底下,按一下 [Age] 資料格,並從下拉式清單中選取 [ProspectiveBuyer.calcAge]。
注意
如果您未在清單中看見資料行,可能必須重新整理設計師中所載入資料來源檢視的定義。 做法是從 [檔案] 功能表選取 [全部儲存],然後在設計師中關閉再重新開啟專案。
按一下 [確定]。
設計預測查詢
若要設計預測查詢
在 [採礦模型預測] 索引標籤工具列上的第一個按鈕是 [切換到設計檢視 / 切換到結果檢視 / 切換到查詢檢視] 按鈕。 按一下此按鈕上的向下箭頭,然後選取 [設計]。
在 [採礦模型預測] 索引標籤的方格中,按一下 [來源] 資料行中第一個空白資料列內的資料格,再選取 [預測函數]。
在 [預測函數] 資料列的 [欄位] 資料行中,選取 [PredictProbability]。
在同一資料列的 [別名] 資料行中,輸入「結果機率」。
從上面的 [採礦模型] 視窗中選取 [Bike Buyer]],並將其拖曳到 [準則/引數] 資料格中。
當您放開滑鼠時,[TM_Decision_Tree].[Bike Buyer] 就會出現在 [準則/引數] 資料格中。
這會指定 PredictProbability 函數的目的地資料行。 如需有關函數的詳細資訊,請參閱<資料採礦延伸模組 (DMX) 函數參考>。
在 [來源] 資料行中,按一下下一個空白資料列,然後選取 [TM_Decision_Tree mining model]。
在 [TM_Decision_Tree] 資料列的 [欄位] 資料行中,選取 [Bike Buyer]。
在 [TM_Decision_Tree] 資料列中,於 [準則/引數] 資料行內輸入 =1
在 [來源] 資料行中,按一下下一個空白資料列,然後選取 [ProspectiveBuyer 資料表]。
在 [ProspectiveBuyer] 資料列的 [欄位] 資料行中,選取 [ProspectiveBuyerKey]。
這會在預測查詢中加入唯一識別碼,供您辨識可能會購買和可能不會購買自行車的人。
將其他五個資料列加入至方格中。 針對每一個資料列選取 [ProspectiveBuyer 資料表] 當做 [來源],然後在 [欄位] 資料格中加入以下資料行:
calcAge
LastName
FirstName
AddressLine1
AddressLine2
最後,執行此查詢並瀏覽結果。
若要執行查詢並檢視結果
在 [採礦模型預測] 索引標籤中,選取 [結果] 按鈕。
當執行此查詢並顯示結果之後,您可以檢閱結果。
[採礦模型預測] 索引標籤會顯示可能購買自行車之潛在客戶的連絡資訊。 [結果機率] 資料行會指出預測正確的機率。 您可以利用這些結果來判斷哪些潛在的客戶應該成為郵寄目標。
此時,您可以儲存結果。 您有三個選項:
以滑鼠右鍵按一下結果中的資料列並選取 [複製],只將該值 (和資料行標題) 儲存至 [剪貼簿]。
以滑鼠右鍵按一下結果中的任何資料列並選取 [全部複製],將整個結果集 (包括資料行標題) 複製到 [剪貼簿]。
按一下 [儲存查詢結果],依照下列方式將結果直接儲存到資料庫:
在 [儲存資料採礦查詢結果] 對話方塊中,選取資料來源,或是定義新的資料來源。
輸入將包含查詢結果之資料表的名稱。
使用 [加入至 DSV] 選項來建立資料表,並將它加入至現有的資料來源檢視。 如果您想要在相同的資料來源檢視中保留模型的所有相關資料表 (例如定型資料、預測來源資料和查詢結果),這樣做就很有用。
使用 [如果存在則覆寫] 選項,以最新的結果更新現有的資料表。
如果您已將任何資料行加入至預測查詢、變更預測查詢中任何資料行的名稱或資料類型,或者已針對目的地資料表執行任何 ALTER 陳述式,就必須使用此選項來覆寫資料表。
此外,如果多個資料行具有相同的名稱 (例如,預設資料行名稱 [運算式]),您就必須針對名稱重複的資料行建立別名,否則當設計師嘗試將結果儲存至 SQL Server 時,將會引發錯誤。 原因是 SQL Server 不允許多個資料行具有相同的名稱。
如需詳細資訊,請參閱<儲存資料採礦查詢結果對話方塊 (採礦模型預測檢視)>。