共用方式為


計分 Vowpal Wabbit 模型

本文說明如何使用 Azure 機器學習 設計工具中的 Score Vowpal Wabbit 模型元件,使用現有的定型 Vowpal Wabbit 模型來產生一組輸入數據的分數。

此元件提供 Vowpal Wabbit 架構 8.8.1 版的最新版本。 使用此元件,以 VW 第 8 版格式儲存的定型模型來評分數據。

如何設定分數 Vowpal Wabbit 模型

  1. Score Vowpal Wabbit 模型 元件新增至您的實驗。

  2. 新增定型的 Vowpal Wabbit 模型,並將其連線到左側輸入埠。 您可以使用在相同實驗中建立的定型模型,或在設計工具左側瀏覽窗格的 [數據集] 類別中找到已儲存的模型。 不過,模型必須在 Azure 機器學習 設計工具中使用。

    注意

    僅支援 Vowpal Wabbit 8.8.1 模型;您無法使用其他演算法來連接已定型的已儲存模型。

  3. 新增測試數據集,並將其連線到右側輸入埠。 如果測試資料集是包含測試資料檔的目錄,請使用測試資料檔的名稱指定測試數據檔名稱。 如果測試數據集是單一檔案,請將測試數據檔的名稱保留空白。

  4. 在 [ VW 自變數 ] 文本框中,將一組有效的命令行自變數輸入至 Vowpal Wabbit 可執行檔。

    如需 Azure 機器學習 支援和不支援哪些 Vowpal Wabbit 自變數的相關信息,請參閱技術注意事項一節。

  5. 測試數據檔的名稱:輸入包含輸入數據的檔名。 只有當測試數據集是目錄時,才會使用此自變數。

  6. 指定檔案類型:指出訓練數據所使用的格式。 Vowpal Wabbit 支援這兩種輸入檔案格式:

    • VW 代表 Vowpal Wabbit 所使用的內部格式。 如需詳細資訊, 請參閱 Vowpal Wabbit Wiki 頁面
    • SVMLight 是一些其他機器學習工具所使用的格式。
  7. 如果您想要將標籤連同分數一起輸出,請選取 [包含標籤的額外資料行] 選項

    一般而言,處理文字數據時,Vowpal Wabbit 不需要標籤,而且只會傳回每個數據列的分數。

  8. 如果您想要將原始分數與結果一起輸出原始分數,請選取 [包含額外分數] 資料行的選項

  9. 提交管線。

結果

完成定型之後:

  • 若要將結果可視化,請以滑鼠右鍵按下評分 Vowpal Wabbit 模型元件的輸出。 輸出表示從 0 標準化為 1 的預測分數。

  • 若要評估結果,輸出數據集應該包含符合評估模型元件需求的特定分數數據行名稱。

    • 針對回歸工作,要評估的數據集必須有一個數據行,名為 Regression Scored Labels,代表評分的標籤。
    • 針對二元分類工作,要評估的數據集必須有兩個數據行,名為 Binary Class Scored LabelsBinary Class Scored Probabilities分別代表評分標籤和機率。
    • 針對多重分類工作,要評估的數據集必須有一個數據行,名為 Multi Class Scored Labels,代表評分的標籤。

    請注意,無法直接評估 Score Vowpal Wabbit 模型元件的結果。 在評估之前,應根據上述需求修改數據集。

技術注意事項

本節包含常見問題的實作詳細數據、秘訣和解答。

參數

Vowpal Wabbit 有許多用於選擇和微調演算法的命令行選項。 此處無法完整討論這些選項;建議您檢視 Vowpal Wabbit Wiki 頁面

Azure 機器學習 Studio (傳統版) 不支援下列參數。

  • 中指定的輸入/輸出選項 https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    元件已經自動設定這些屬性。

  • 此外,不允許產生多個輸出或接受多個輸入的任何選項。 這些包括 --cbt--lda--wap

  • 僅支援受監督式學習演算法。 這不允許這些選項:–active--rank--search 等。

允許上述自變數以外的所有自變數。

下一步

請參閱 Azure 機器學習 可用的元件集。