測試採礦模型的精確度 (資料採礦教學課程)
在您針對作為目標的郵件假設狀況建置、處理並探索採礦模型之後,可以測試模型,以判斷執行預測的效果有多好,並可判斷是否有其中一個模型執行得特別好。
在資料採礦設計師的 [採礦精確度圖表] 索引標籤,您可以計算出每個模型執行預測的效果有多好,也能夠對照其他模型的結果,直接比較每一個模型的結果。這種比較方法可稱為*「增益圖」*。[採礦精確度圖表] 索引標籤使用輸入資料 (與原始資料集單獨分開的資料) 來對照已知結果,將預測作出比較。接著再將比較的結果排序之後,繪製到圖形中。圖形中也會繪製出理想的模型,也就是每次都百分之百正確預測出結果的理論性質模型。您可以對照理想模型的結果比較實際模型的結果,以瞭解模型執行預測的效果有多好。如需有關增益圖使用方式的詳細資訊,請參閱<增益圖>。
增益圖之所以重要,是因為它有助於將結構中幾乎相同的模型加以區分,以協助您判斷哪一個模型的預測能力最佳。同樣地,增益圖能顯示出,針對特定狀況,以哪種類型的演算法的預測執行能力最佳。如需有關 [採礦精確度圖表] 索引標籤使用方法的詳細資訊,請參閱<驗證資料採礦模型>。
本主題中,您將會執行下列工作:
- 對應輸入資料行
- 篩選輸入資料列
- 選取模型、可預測資料行及值
- 檢視增益圖
對應輸入資料行
若要測試採礦模型的精確度,第一個步驟就是將採礦結構中的資料行對應至輸入資料中的資料行。如果資料行的名稱能夠直接對應,資料採礦設計師就會自動建立關聯性。
若要將輸入資料行對應至採礦結構
在資料採礦設計師中 [採礦精確度圖表] 索引標籤的 [資料行對應] 索引標籤,按一下 [選取輸入資料表] 方塊中的 [選取案例資料表]。
此時會開啟 [選取資料表] 對話方塊。在這個對話方塊,您可以選取含有輸入資料的資料表,這些資料就是您在預測查詢中判斷模型精確度時,所想使用的資料。本教學課程中,您將在輸入資料行中使用的資料與您用來處理模型的資料相同。然而理想的情況下,輸入資料行應當是與處理模型所使用的資料分開,在個別資料列的不同資料。您可以在 [選取資料表] 對話方塊中,以輸入資料行的形式選取該資料。
在 [資料來源] 清單中,確認已選取 [Adventure Works DW]。
在 [資料表/檢視名稱] 清單中,選取 [vTargetMail],再按一下 [確定]。
採礦結構中的資料行會自動對應至輸入資料表中名稱相同的資料行。
對於結構中的每一個模型,會根據資料行對應產生預測查詢。若要刪除兩個資料行之間的對應,請選取將 [採礦結構] 資料表中的資料行連結到 [選取輸入資料表] 資料表中資料行的線條,再按 DELETE 鍵。您也可以手動建立對應,其作法是按一下 [選取輸入資料表] 中的資料行,然後拖曳至 [採礦結構] 中對應的資料行。
篩選輸入資料列
您可以使用 [篩選用於產生增益圖的輸入資料] 之下的方格來篩選輸入資料。您可以將 [選取輸入資料表] 的資料行拖曳至方格,也可以按一下方格中的資料行再使用所顯示的值清單來選取值。例如,如果您要將輸入資料列限定為其中的 [收益] 資料行大於 x 的部份,請選取 [來源] 資料行中的 [vTargetMail] 以及 [欄位] 資料行中的 [收益],接著在 [準則/引數] 資料行中輸入 >x。
請注意,本教學課程中不會請您篩選資料。
選取模型、可預測資料行及值
下一個步驟是選取您想要併入增益圖中的模型,以及選取比較模型時所對照的可預測資料行。依預設,會選取採礦結構中所有的模型。您可以選擇不併入某個模型,但在本教學課程中則是維持選取所有模型。
您可以建立兩種類型的精確度圖表。如果選取可預測的值,出現的圖表就會顯示模型提供多大的增益。如果沒有併入可預測的值,則圖表會顯示模型的精確度。
若要顯示模型的增益
在 [選取可預測的採礦模型資料行,以顯示在增益圖中],確認已在 [可預測的資料行名稱] 清單中為每一個模型選取 [Bike Buyer]。
在 [預測值] 資料行中,為每一個模型都選取 [1]。
若要顯示模型的精確度
在 [選取可預測的採礦模型資料行,以顯示在增益圖中],確認已在 [可預測的資料行名稱] 清單中為每一個模型選取 [Bike Buyer]。
將 [預測值] 資料行保留空白。
如果選取 [同步處理預測資料行和值] 核取方塊,就會為採礦結構中的每一個採礦模型同步處理可預測資料行。
附註: |
---|
[可預測資料行名稱] 清單中列出的採礦模型資料行,以使用類型設定為 Predict 或 Predict Only 的資料行為限。資料行也必須以內容類型設定為 Discrete 或 Discretized 的採礦結構資料行為基礎。 |
在某些進一步的假設狀況中,您可以產生一份增益圖來包含在兩個「並非基於相同採礦結構資料行,但卻包含相同資料」之採礦模型中的可預測資料行。如果清除 [同步處理預測資料行和值] 核取方塊,便可選取任何有效的可預測資料行和值。其結果無論是否有道理,都會繪製在一起。
檢視增益圖
若要檢視增益圖,請切換到 [採礦精確度圖表] 的 [增益圖] 索引標籤。當您按一下這個索引標籤時,會在伺服器和資料庫上,執行採礦結構和輸入資料表的預測查詢。預測的結果會與已知的實際值相比較,並且繪製到圖形中。如需有關圖表用法的詳細資訊,請參閱<增益圖>。