合併計數轉換
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
建立以計數資料表為基礎的一組特徵
Category:具有計數的 Learning
模組概觀
本文描述如何使用機器學習 Studio (傳統) 中的「合併計數轉換」模組,結合兩組以計數為基礎的特徵。 藉由合併兩組相關的計數和功能,您可能會改善功能的涵蓋範圍和散發。
在具有高基數特徵的大型資料集內,從計數 Learning 特別有用。 將多個資料集合併成以計數為基礎的特徵集,而不需要重新處理資料集,可讓您更輕鬆地收集非常大型資料集的統計資料,並將其套用至新的資料集。 例如,您可以使用計數資料表來收集超過數 tb 資料的資訊。 您可以重複使用這些統計資料,以改善小型資料集的預測性模型精確度。
若要合併兩組以計數為基礎的功能,您必須使用具有相同架構的資料表建立這些功能:也就是說,這兩個集合都必須使用相同的資料行,而且具有相同的名稱和資料類型。
如何設定合併計數轉換
若要使用 合併計數轉換,您必須建立至少一個以計數為基礎的轉換,而且該轉換必須存在於您的工作區中。 如果您是從不同的實驗儲存以計數為基礎的轉換,請查看 [ 轉換 ] 群組。 如果您在目前的實驗中建立轉換,請連接下列模組的輸出:
將「 合併計數轉換 」模組新增至實驗,並將轉換連接到每個輸入。
提示
第二個轉換是選擇性的輸入,您可以連接相同的轉換兩次,或在第二個輸入埠上連接任何內容。
如果您不想讓第二個資料集使用第一個資料集來平均加權,請指定 [ 衰減因數] 的值。 您輸入的值會指出如何加權第二個轉換的一組功能。
例如,1個加權的預設值會有同樣的功能集。 值 .5 表示第二個集合中的功能在第一個集合中有一半的加權。
(選擇性)加入套用 轉換 模組的實例,並將轉換套用至資料集。
範例
如需如何使用此模組的範例,請參閱 Azure AI 資源庫:
具有計數的 Learning:二元分類:示範如何使用 Learning with count 模組,從二元分類模型的類別值資料行產生特徵。
具有計數的 Learning:多元分類與 NYC 計程車資料:示範如何使用「使用計數學習」模組,在公開可用的 NYC 計程車資料集上執行多元分類。 此範例使用多元羅吉斯回歸學習模組來建立此問題的模型。
具有計數的 Learning:使用 NYC 計程車資料的二元分類:示範如何在公開可用的 NYC 計程車資料集上使用具有計數的學習模組來執行二元分類。 此範例使用兩個類別的羅吉斯回歸學習模組來建立問題的模型。
預期的輸入
名稱 | 類型 | 說明 |
---|---|---|
先前的計數轉換 | ITransform 介面 | 要編輯的計數轉換 |
新的計數轉換 | ITransform 介面 | 要新增 (選擇性) 的計數轉換 |
模組參數
名稱 | 類型 | 範圍 | 選用 | 描述 | 預設 |
---|---|---|---|---|---|
衰減因數 | Float | 必要 | 1.0f | 要乘以右邊輸入埠之計數轉換的衰減因數 |
輸出
名稱 | 類型 | 說明 |
---|---|---|
合併的計數轉換 | ITransform 介面 | 合併的轉換 |
例外狀況
例外狀況 | 描述 |
---|---|
錯誤 0003 | 如果一或多個輸入為 Null 或空白,就會發生例外狀況。 |
錯誤 0086 | 計數轉換無效時所發生的例外狀況。 |