計分 Vowpal Wabbit 第8版模型
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
從命令列介面使用 Vowpal Wabbit 機器學習系統來評分資料
Category:文字分析
模組概觀
本文描述如何使用機器學習 Studio (傳統) 中的計分 Vowpal Wabbit 第8版模型模組,以使用現有定型的 Vowpal Wabbit 模型來產生一組輸入資料的分數。
此課程模組提供最新版的 Vowpal Wabbit framework 第8版。 您可以使用此模組,使用以 VW 8 版格式儲存的定型模型來評分資料。
如果您有使用較早版本建立的現有模型,請使用下列模組:
如何設定計分 Vowpal Wabbit 模型8
將 計分 Vowpal Wabbit 第8版模型 模組新增至您的實驗。
新增已定型的 Vowpal Wabbit 模型,並將其連線到左側的輸入埠。 您可以使用在相同實驗中建立的定型模型,或在 Studio 的 定型模型 群組中找出已儲存的模型 (傳統) 的左側流覽窗格。 不過,模型必須可在機器學習 Studio (傳統) 中使用; 您無法直接從 Azure 儲存體載入模型。
注意
只支援 Vowpal Wabbit 8 模型;您無法連接使用其他演算法定型的已儲存模型,也無法使用使用舊版定型的模型。
在 [VW 引數] 文字方塊中,輸入一組對 Vowpal Wabbit 可執行檔有效的命令列引數。
如需機器學習中支援和不支援哪些 Vowpal Wabbit 引數的相關資訊,請參閱技術提示一節。
按一下 [ 指定資料類型],然後從清單中選取其中一個支援的資料類型。
計分需要 VW 相容資料的單一資料行。
如果您有以 SVMLight 或 VW 格式建立的現有檔案,您可以使用下列其中一種格式,將它以新的資料集形式載入 Azure ML 工作區:不含標頭的一般 CSV、TSV 沒有標頭。
VW選項需要有標籤,但不會用於計分,除非比較。
新增 [匯 入資料 ] 模組,並將其連接至 [ 計分 Vowpal Wabbit 第8版] 的右手邊輸入埠。 設定匯 入資料 以存取輸入資料。
評分的輸入資料必須事先以其中一種支援的格式預先準備,並儲存在 Azure blob 儲存體中。
如果您想要一起輸出標籤與分數,請選取 [加入包含標籤的額外資料行] 選項。
一般來說,在處理文字資料時,Vowpal Wabbit 不需要標籤,而且只會傳回每個資料列的分數。
如果您想要一起輸出原始分數與結果,請選取 [加入包含原始分數的額外資料行] 選項。
提示
此選項是 Vowpal Wabbit 第8版的新選項。
如果您想要重複使用先前執行的結果,請選取 [使用快取的 結果] 選項,假設符合下列條件:
先前的執行中有有效的快取。
自上一次執行之後,模組的輸入資料和參數設定未變更。
否則,每次執行實驗時都會重複匯入程式。
執行實驗。
結果
定型完成後:
- 若要以視覺化方式呈現結果,請以滑鼠右鍵按一下 計分 Vowpal Wabbit 第8版模型 模組的輸出。
該輸出會指出已正規化為 0 到 1 的預測分數。
範例
如需如何在機器學習中使用 Vowpal Wabbit 的範例,請參閱 Azure AI 資源庫:
-
此實驗示範 VW 模型的資料準備、定型和運算化。
下列影片提供 Vowpal Wabbit 的訓練和評分程式逐步解說:
技術說明
本節包含實作詳細資料、提示和常見問題集的解答。
參數
Vowpal Wabbit 有許多命令列選項可用於選擇和微調演算法。 這裡無法提供這些選項的完整討論;建議您檢視 Vowpal Wabbit wiki 頁面。
機器學習 Studio (傳統) 中不支援下列參數。
https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments 中指定的輸入/輸出選項
模組已自動設定這些屬性。
此外,也不允許產生多個輸出或接受多個輸入的任何選項。 其中包括
--cbt
、--lda
和--wap
。僅支援受監督的學習演算法。 這不允許下列選項:
–active
、--rank
、--search
等等。
上述引數以外的所有引數則允許使用。
預期的輸入
名稱 | 類型 | Description |
---|---|---|
定型的模型 | ILearner 介面 | 定型的學習模組 |
資料集 | 資料表 | 要評分的資料集 |
模組參數
名稱 | 範圍 | 類型 | 預設 | 描述 |
---|---|---|---|---|
指定資料類型 | VW SVMLight |
DataType | VW | 指出檔案類型是否為 SVMLight 或 Vowpal Wabbit |
VW 引數 | 任意 | String | 無 | 輸入 Vowpal Wabbit 引數。 請勿包含-i 或-p,或-t |
加入包含標籤的額外資料行 | True/False | Boolean | false | 指定壓縮檔是否應該包含標籤與預測 |
包含包含原始分數的額外資料行 | True/False | Boolean | false | 指定結果是否應該包含額外的資料行,其中包含與--raw_predictions 對應的原始分數 () |
輸出
名稱 | 類型 | 說明 |
---|---|---|
結果資料集 | 資料表 | 含預測結果的資料集 |
例外狀況
例外狀況 | 描述 |
---|---|
錯誤 0001 | 如果找不到資料集的一或多個指定的資料行,就會發生例外狀況。 |
錯誤 0003 | 如果一或多個輸入為 Null 或空白,就會發生例外狀況。 |
錯誤 0004 | 如果參數小於或等於特定值,就會發生例外狀況。 |
錯誤 0017 | 如果一或多個指定的資料行具有目前模組不支援的類型,就會發生例外狀況。 |
如需 Studio (傳統) 模組特定的錯誤清單,請參閱機器學習錯誤碼。
如需 API 例外狀況的清單,請參閱機器學習 REST API 錯誤碼。
另請參閱
文字分析
特性雜湊
具名實體辨識
計分 Vowpal Wabbit 7-4 模型
定型 Vowpal Wabbit 7-4 模型
定型 Vowpal Wabbit 8 模型
A-Z 模組清單