共用方式為


建立目標郵寄採礦模型結構 (資料採礦教學課程)

建立目標郵寄狀況的第一個步驟是,利用 Business Intelligence Development Studio 中的資料採礦精靈來建立新的採礦結構和決策樹採礦模型。

詳細資訊

資料採礦精靈, 資料採礦設計師, Microsoft 決策樹演算法

若要建立目標郵寄狀況的採礦結構

  1. 在 [方案總管] 中,以滑鼠右鍵按一下 [採礦結構],再選取 [新增採礦結構]

    此時會開啟「資料採礦精靈」。

  2. [歡迎使用資料採礦精靈] 頁面上,按 [下一步]

  3. [選取定義方法] 頁面上,確認已選取 [從現有的關聯式資料庫或資料倉儲],再按 [下一步]

  4. [選取資料採礦技術] 頁面的 [您要使用哪一種資料採礦技術?] 之下,選取 [Microsoft 決策樹]

    在這個教學課程中,您將建立若干基於這個起始採礦結構的模型。精靈作業完成時,會同時建立第一個模型和結構,且會以 Microsoft 決策樹演算法為基礎。

  5. [下一步]

  6. [選取資料來源檢視] 頁面上,請注意,依預設會選取 Adventure Works DW。請按一下 [瀏覽] 來檢視資料來源檢視中的資料表,再按一下 [關閉] 以返回精靈。

  7. [下一步]

  8. [指定資料表類型] 頁面上,選取 [vTargetMail] 資料表旁 [案例] 資料行中的核取方塊,再按 [下一步]

  9. [指定培訓資料] 頁面上,確認已選取 [CustomerKey] 資料行旁 [索引鍵] 資料行中的核取方塊。

    如果資料來源檢視中的來源資料表指出索引鍵,資料採礦精靈會自動選擇這個資料行來作為模型的索引鍵。

  10. 選取 [BikeBuyer] 資料行旁的 [輸入][可預測]

    當您指出資料行是可預測時,就會啟用 [建議] 按鈕。按一下 [建議] 會開啟 [建議相關資料行] 對話方塊,列出與可預測資料行關係最密切的資料行。

    [建議相關資料行] 對話方塊會依照與可預測屬性的相互關聯來排列各個屬性。值大於 0.05 的資料行會自動併入模型中。如果您同意這些建議,請按一下 [確定],這會將所選的資料行標示為精靈中的輸入資料行。在這個教學課程中,請按一下 [取消] 來忽略這些建議。

  11. 選取下列資料行旁的 [輸入] 核取方塊:

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    您可以利用 SHIFT 鍵來選取多個資料行。

  12. [下一步]

  13. [指定資料行的內容和資料類型] 頁面上,按一下 [偵測]

    此時會有一個演算法執行這個範例數值資料,判斷數值資料行包含連續值或分隔值。例如,資料行可能包含薪資資訊來作為實際的薪資值,此時它們是連續的;也可能包含代表編碼薪資範圍 (如 1 = < $25,000;2 = $25,000 至 $50,000) 的整數,此時它們是分隔的。

  14. 按一下 [偵測] 之後,請確定 [內容類型][資料類型] 資料行的項目含有下表列出的設定。

    資料行 內容類型 資料類型

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

ms170347.note(zh-tw,SQL.90).gif附註:
如果完全根據數值,資料採礦演算法將會提示 GeographyKey 資料行要包含連續數值。但是,像郵遞區號這樣的數字通常應該視為分隔值,而非連續數值,因為使用這些數字做數學運算,是沒有意義的。
  1. [下一步]
  2. [正在完成精靈] 頁面的 [採礦結構名稱] 中,輸入 [目標郵寄]
  3. [採礦模型名稱] 中,輸入 [TM_Decision_Tree]
  4. 選取 [允許使用鑽研] 核取方塊。
  5. 按一下 [完成]

本課程的下一項工作

修改目標郵寄模型 (資料採礦教學課程)