共用方式為


在 機器學習 Studio 中解譯模型結果 (傳統)

適用於:這是複選標記,這表示本文適用於 機器學習 Studio(傳統版)。機器學習 Studio(傳統版)這是 X,這表示本文不適用於 Azure 機器學習。Azure 機器學習

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

本主題說明如何在 機器學習 Studio 中可視化和解譯預測結果(傳統)。 在您定型模型並在模型之上完成預測之後(「評分模型」),您需要瞭解並解譯預測結果。

機器學習 Studio 中有四種主要的機器學習模型(傳統):

  • 分類
  • 叢集
  • 迴歸
  • 推薦系統

這些模型上用於預測的模組如下:

瞭解如何選擇參數,以在ML Studio中優化您的演算法(傳統版)。

若要瞭解如何評估模型,請參閱 如何評估模型效能

如果您不熟悉 ML Studio(傳統版), 請瞭解如何建立簡單的實驗

分類

分類問題有兩個子類別:

  • 只有兩個類別的問題(兩個類別或二元分類)
  • 兩個以上類別的問題(多類別分類)

機器學習 Studio(傳統版)有不同的模塊來處理這些類型的分類,但解譯其預測結果的方法很類似。

雙類別分類

範例實驗

雙類別分類問題的範例是鳶尾花的分類。 工作是根據其特徵分類鳶尾花。 機器學習 Studio (傳統) 中提供的鳶尾花數據集是熱門鳶尾花數據集的子集,其中包含只有兩個花卉物種的實例(類別 0 和 1)。 每個花有四個特徵(花瓣長度、花瓣寬度、花瓣長度和花瓣寬度)。

鳶尾花實驗的螢幕快照

圖 1. 鳶尾花二級分類問題實驗

已執行實驗來解決此問題,如圖 1 所示。 已定型和評分兩級提升判定樹模型。 現在,您可以按兩下評分模型模組的輸出埠,然後按兩下 [可視化],以可視化評分模型模組的預測結果。

評分模型模組

這會顯示評分結果,如圖 2 所示。

鳶尾花二級分類實驗的結果

圖 2. 以兩個類別分類將分數模型結果可視化

結果解譯

結果數據表中有六個數據行。 左側四個數據行是四個特徵。 右兩個數據行:評分標籤和評分機率,是預測結果。 [評分機率] 資料行會顯示花屬於正類別 (類別 1) 的機率。 例如,數據行中的第一個數位 (0.028571) 表示第一個花屬於類別 1 的機率為 0.028571。 [評分標籤] 資料行會顯示每個花的預測類別。 這是以評分機率數據行為基礎。 如果花的評分機率大於 0.5,則會預測為類別 1。 否則,它會預測為類別 0。

Web 服務發行集

在了解預測結果並判斷聲音之後,實驗可以發佈為 Web 服務,以便您可以在各種應用程式中部署它,並呼叫它來取得任何新虹膜花的類別預測。 若要瞭解如何將定型實驗變更為評分實驗,並將其發佈為Web服務,請參閱 教學課程 3:部署信用風險模型。 此程式提供評分實驗,如圖 3 所示。

評分實驗的螢幕快照

圖 3. 評分鳶尾花兩類分類問題實驗

現在您需要設定 Web 服務的輸入和輸出。 輸入是評分模型的正確輸入埠,這是鳶尾花特徵輸入。 輸出的選擇取決於您是否對預測類別(評分標籤)、評分機率或兩者感興趣。 在此範例中,假設您對此兩者感興趣。 若要選取所需的輸出資料行,請使用 選取資料集 模組中的數據行。 按兩下 [在數據集中選取數據行],按兩下 [啟動數據行選取器],然後選取 [評分標籤] 和 [評分機率]。 在數據集中設定 [選取數據行] 的輸出埠並再次執行之後,您應該已準備好按兩下 [發佈WEB服務] 將評分實驗發佈為Web服務。 最終實驗看起來像圖 4。

鳶尾花二級分類實驗

圖 4。 鳶尾花二級分類問題的最終評分實驗

執行 Web 服務並輸入測試實例的某些功能值之後,結果會傳回兩個數位。 第一個數位是評分標籤,第二個是評分機率。 此花預測為類別 1,機率為 0.9655。

測試解譯分數模型

評分測試結果

圖 5。 鳶尾花雙類別分類的Web服務結果

多元分類

範例實驗

在此實驗中,您會執行字母辨識工作做為多類別分類的範例。 分類器會根據從手寫影像擷取的一些手寫屬性值,嘗試預測特定字母 %28class%29。

字母辨識範例

在定型數據中,有16個特徵是從手寫的信件影像擷取。 26 個字母構成我們的 26 個類別。 圖 6 顯示實驗,該實驗會針對字母辨識定型多類別分類模型,並在測試數據集上的相同特徵集上預測。

字母辨識多類別分類實驗

圖 6。 字母辨識多類別分類問題實驗

按兩下評分模型模組的輸出埠,然後按兩下 [可視化],即可可視化評分模型模組的結果,您應該會看到如圖 7 所示的內容。

評分模型結果

圖 7。 在多類別分類中將評分模型結果可視化

結果解譯

左邊 16 個數據行代表測試集的功能值。 類別 「XX」 名稱為 Scored Probabilities 的數據行,就像兩個類別案例中的 [評分機率] 資料行一樣。 它們會顯示對應專案屬於特定類別的機率。 例如,針對第一個專案,有0.003571機率是 “A”,0.000451 機率是 “B”,依此類推。 最後一個數據行 (評分標籤) 與兩個類別案例中的評分標籤相同。 它會選取具有最大評分機率的類別,作為對應專案的預測類別。 例如,針對第一個專案,評分標籤是 “F”,因為它的最大機率是 “F” (0.916995)。

Web 服務發行集

您也可以取得每個項目的評分標籤,以及評分標籤的機率。 基本邏輯是在所有評分機率中尋找最大機率。 若要這樣做,您必須使用 執行 R 腳本 模組。 R 程式代碼會顯示在圖 8 中,而實驗的結果會顯示在圖 9 中。

R 程式代碼範例

圖 8。 用於擷取評分標籤的 R 程式代碼和標籤的相關機率

實驗結果

圖 9。 字母辨識多類別分類問題的最終評分實驗

發佈並執行 Web 服務並輸入一些輸入特徵值之後,傳回的結果看起來像圖 10。 此手寫字母,其擷取的16個特徵,預測為具有0.9715機率的“T”。

測試解譯分數模組

測試結果

圖 10。 多類別分類的 Web 服務結果

迴歸

回歸問題與分類問題不同。 在分類問題中,您正嘗試預測離散類別,例如鳶尾花所屬的類別。 但是,如下列回歸問題的範例所示,您正嘗試預測連續變數,例如汽車的價格。

範例實驗

使用汽車價格預測作為回歸的範例。 您正嘗試根據汽車的特性來預測汽車的價格,包括製造、燃料類型、身體類型和駕駛方向盤。 實驗如圖 11 所示。

汽車價格回歸實驗

圖 11。 汽車價格回歸問題實驗

將評分模型模組可視化,結果看起來像圖 12。

汽車價格預測問題的評分結果

圖 12. 汽車價格預測問題的評分結果

結果解譯

評分標籤是此評分結果中的結果數據行。 這些數位是每輛車的預測價格。

Web 服務發行集

您可以將回歸實驗發佈至 Web 服務,並以與雙類別分類使用案例相同的方式呼叫它來進行汽車價格預測。

汽車價格回歸問題的評分實驗

圖 13. 汽車價格回歸問題的評分實驗

執行 Web 服務時,傳回的結果看起來像圖 14。 這輛車的預測價格為15,085.52美元。

測試解譯評分模組

評分模組結果

圖 14. 汽車價格回歸問題的 Web 服務結果

叢集

範例實驗

讓我們再次使用鳶尾花數據集來建置叢集實驗。 您可以在這裏篩選掉數據集中的類別標籤,使其只具有功能,而且可用於叢集。 在此鳶尾花使用案例中,指定定型程式中要兩個叢集的數目,這表示您會將花叢集分成兩個類別。 實驗如圖 15 所示。

鳶尾花叢集問題實驗

圖 15. 鳶尾花叢集問題實驗

叢集與分類不同,因為定型數據集本身並沒有基礎事實標籤。 叢集會將定型數據集實例分組成不同的叢集。 在定型程序期間,模型會藉由學習其特徵之間的差異來標記專案。 之後,定型的模型可以用來進一步分類未來的專案。 在叢集問題中,我們感興趣的結果有兩個部分。 第一個部分是標記定型數據集,第二個部分是使用定型的模型來分類新的數據集。

按兩下 [定型叢集模型] 的左側輸出埠,然後按兩下 [可視化],即可可視化結果的第一個部分。 圖 16 顯示視覺效果。

叢集結果

圖 16. 將定型數據集的叢集結果可視化

第二個部分的結果,將新專案與定型的群集模型叢集在一起,如圖 17 所示。

將叢集結果可視化

圖 17. 將新數據集上的叢集結果可視化

結果解譯

雖然這兩個部分的結果源自不同的實驗階段,但它們看起來相同,並以相同方式解譯。 前四個數據行是特徵。 最後一個數據行 Assignments 是預測結果。 指派相同數位的項目會預測在同一個叢集中,也就是說,它們以某種方式共用相似性(此實驗使用預設的 Euclidean 距離計量)。 因為您指定了叢集數目為 2,工作分派中的項目會標示為 0 或 1。

Web 服務發行集

您可以將叢集實驗發佈至 Web 服務,並將其呼叫為叢集預測的方式,就像在雙類別分類使用案例中一樣。

鳶尾花叢集問題的評分實驗

圖 18. 鳶尾花叢集問題的評分實驗

執行 Web 服務之後,傳回的結果看起來像圖 19。 此花預測為叢集 0。

測試解譯評分模組

評分模組結果

圖 19. 鳶尾花雙類別分類的Web服務結果

推薦系統

範例實驗

針對推薦系統,您可以使用餐廳推薦問題作為範例:您可以根據客戶的評等歷程記錄,為顧客推薦餐廳。 輸入資料包含三個部分:

  • 來自客戶的餐廳評等
  • 客戶功能數據
  • 餐廳特色資料

在 機器學習 Studio 中,我們可以使用定型 Matchbox 推薦模組進行幾項操作(傳統):

  • 預測指定使用者和項目的評等
  • 將項目建議給指定的使用者
  • 尋找與指定使用者相關的使用者
  • 尋找與指定專案相關的專案

您可以從 [推薦預測類型] 選單中的四個選項中選取,以選擇您想要執行的動作。 您可以在這裡逐步解說這四個案例。

Matchbox 建議工具

推薦系統的一般 機器學習 Studio(傳統)實驗看起來像圖 20。 如需如何使用這些推薦系統模塊的資訊,請參閱將 matchbox 推薦和評分比對方塊推薦定型。

推薦系統實驗

圖 20. 推薦系統實驗

結果解譯

預測指定使用者和項目的評等

藉由選取 [推薦預測類型] 底下的 [評等預測],您會要求推薦系統預測指定使用者和專案的評等。 評分比對方塊推薦輸出視覺效果看起來像圖 21。

推薦系統的評分結果 - 評等預測

圖 21. 可視化推薦系統的評分結果-評等預測

前兩個數據行是輸入數據所提供的用戶專案組。 第三個數據行是特定專案的用戶預測評等。 例如,在第一個數據列中,客戶 U1048 預測為將餐廳135026評為 2。

將項目建議給指定的使用者

藉由選取 [推薦預測類型] 底下的 [項目建議],您會要求推薦系統將項目推薦給指定的使用者。 在此案例中選擇的最後一個參數是 建議的項目選取專案。 [來自評分專案] 選項 (用於模型評估) 主要是在定型程式期間進行模型評估。 在此預測階段中,我們選擇 [從所有專案]。 評分比對方塊推薦輸出視覺效果看起來像圖 22。

推薦系統的評分結果 - 項目建議

圖 22. 將推薦者的分數結果可視化--項目建議

六個數據行中的第一個代表指定的使用者標識符來建議專案,如輸入數據所提供。 其他五個數據行代表以相關性遞減順序向使用者建議的專案。 例如,在第一個數據列中,客戶 U1048 最建議的餐廳是134986,後面接著135018、134975、135021和132862。

尋找與指定使用者相關的使用者

藉由選取 [推薦預測類型] 底下的 [相關使用者],您會要求推薦系統尋找與指定使用者相關的使用者。 相關使用者是具有類似喜好設定的使用者。 在此案例中選擇的最後一個參數是 [相關用戶選取]。 [來自已評等專案的使用者] 選項 (用於模型評估) 主要是在定型程式期間進行模型評估。 針對此預測階段,選擇 [所有使用者 ]。 評分比對方塊推薦輸出的視覺效果看起來像圖 23。

推薦系統 -- 相關使用者的評分結果

圖 23. 將推薦系統相關使用者的分數結果可視化

六個數據行中的第一個會顯示尋找相關使用者所需的指定使用者識別碼,如輸入數據所提供。 其他五個數據行會以相關性遞減順序儲存使用者預測的相關使用者。 例如,在第一個數據列中,客戶 U1048 最相關的客戶是 U1051,後面接著 U1066、U1044、U1017 和 U1072。

尋找與指定專案相關的專案

藉由選取 [推薦預測種類] 底下的 [相關專案],您會要求推薦系統尋找指定專案的相關專案。 相關專案是同一位使用者最有可能喜歡的專案。 在此案例中選擇的最後一個參數是 [相關專案] 選取專案。 [來自評分專案] 選項 (用於模型評估) 主要是在定型程式期間進行模型評估。 我們為此預測階段選擇 [從所有專案 ]。 評分比對方塊推薦輸出視覺效果看起來像圖 24。

推薦系統的評分結果 --相關專案

圖 24. 將推薦系統相關專案的分數結果可視化

六個數據行中的第一個代表尋找相關專案所需的指定專案標識元,如輸入數據所提供。 其他五個數據行會以相關性遞減順序儲存專案的預測相關專案。 例如,在第一個數據列中,專案135026最相關的專案是135074,後面接著135035、132875、135055和134992。

Web 服務發行集

將這些實驗發佈為 Web 服務以取得預測的程式,與這四個案例中的每一個都類似。 在這裡,我們將第二個案例(建議專案給指定的用戶)作為範例。 您可以使用其他三個程式遵循相同的程式。

將定型推薦系統儲存為定型模型,並視要求將輸入數據篩選至單一使用者標識符數據行,您可以將實驗連結為圖 25,並將其發佈為 Web 服務。

餐廳推薦問題的評分實驗

圖 25. 餐廳推薦問題的評分實驗

執行 Web 服務時,傳回的結果看起來像圖 26。 使用者 U1048 的五家建議餐廳是134986、135018、134975、135021和132862。

推薦系統服務的範例

實驗結果範例

圖 26. 餐廳推薦問題的 Web 服務結果