個人化工具術語
重要
從 2023 年 9 月 20 日起,您將無法建立新的個人化工具資源。 個人化工具服務將於 2026 年 10 月 1 日淘汰。
個人化工具使用增強式學習的術語。 這些術語適用於 Azure 入口網站和 API。
概念術語
學習迴圈:您建立個人化工具,稱為學習迴圈,適用於可從個人化獲益的應用程式各個組件。 如果您有多個要個人化的經驗,請為每個經驗各建立一個迴圈。
模型:個人化工具模型會擷取所有已學習到的使用者行為相關資料,結合您傳送給排名和獎勵呼叫的引數以及學習原則所決定的定型行為,來取得定型資料。
線上模式:個人化工具的預設學習行為 (您的「學習迴圈」),會使用機器學習來建置模型,以預測內容的最佳動作。
新手模式:這種學習行為可協助您在不影響應用程式結果和動作的情況下,進行定型的個人化工具模型暖啟動。
學習行為:
- 線上模式:傳回最佳動作。 您的模型會以最佳動作回應順位呼叫,並會使用獎勵呼叫進行學習,經過一段時間之後,即會改善其選取項目。
- 新手模式:以新手身分學習。 您的模型將會藉由觀察現有系統的行為來學習。 排名呼叫一律會將應用程式的預設動作傳回 (基準)。
個人化工具組態
個人化工具是從 Azure 入口網站設定。
獎勵:設定獎勵等候時間、預設獎勵和獎勵匯總原則的預設值。
探索:設定用於探索的排名呼叫百分比
模型更新頻率:重新定型模型的頻率。
資料保留:需要儲存資料多少天。 這可能會影響離線評估,該評估是用來改善您的學習迴圈。
使用排名 API 和獎勵 API
排名:由於具有特徵和內容特徵的動作,請使用探索或惡意探索,以傳回最佳動作 (內容項目)。
動作:動作是可從中選擇的內容項目,例如產品或促銷活動。 個人化工具會透過排名 API 選擇最佳動作 (傳回的獎勵動作識別碼) 來對使用者顯示。
內容:若要提供更精確的排名,請提供內容的相關資訊,例如:
- 您的使用者。
- 其所使用的裝置。
- 目前的時間。
- 其他關於目前情況的資料。
- 關於使用者或內容的歷史資料。
特定應用程式可能會有不同的內容資訊。
特徵:內容項目或使用者內容的相關資訊單位。 請務必只使用彙總的功能。 請勿使用特定時間、使用者識別碼或其他非彙總資料作為特徵。
- 動作特徵是內容的相關中繼資料。
- 內容特徵是指內容呈現所在的內容相關中繼資料。
探索:個人化工具服務在為使用者選擇不同動作時會進行探索,而不是傳回最佳動作。 個人化工具服務可避開變化、停滯,並可藉由探索來適應不斷發展的使用者行為。
學到的最佳動作:個人化工具服務會使用目前的模型,根據過去的資料來決定最佳動作。
實驗持續時間:個人化工具服務等候獎勵的時間量,從該事件發生排名呼叫的當下起算。
非作用中事件:當您呼叫排名,但不確定使用者是否會看到結果 (因為用戶端應用程式的決定) 時,便是非作用中事件。 非作用中事件可讓您建立並儲存個人化結果,並在不會影響機器學習模型的情況下,於之後決定捨棄這些結果。
獎勵:可測量使用者與排名 API 所傳回獎勵動作的對應程度,以 0 到 1 之間的分數來表示。 0 到 1 的值是由商務邏輯根據所做選擇對協助達成個人化商務目標有多大幫助而做出設定。 學習迴圈不會將這個獎勵儲存為個別的使用者歷程記錄。
評估
離線評估
評估:離線評估會根據您的應用程式資料,決定迴圈的最佳學習原則。
學習原則:個人化工具針對每個事件定型模型的方式,將取決於某些參數,這些參數會影響機器學習演算法的運作方式。 新的學習迴圈從預設學習原則開始,這可能會產生適中的效能。 執行評估時,個人化工具會建立特別針對您的迴圈使用案例最佳化的新學習原則。 使用針對每個特定迴圈最佳化的原則 (在評估期間產生),個人化工具會大幅提升效能。 學習原則會在 Azure 入口網站中個人化工具資源的模型和學習設定上,命名為學習設定。
新手模式評估
新手模式提供下列評估計量:
- 基準 – 平均獎勵:應用程式預設值的平均獎勵 (基準)。
- 個人化工具–平均獎勵:個人化工具可能已達到的總獎勵平均值。
- 平均輪流獎勵:基準和個人化工具獎勵的比率 – 於最近的 1000 個事件標準化。
下一步
- 深入了解倫理與責任使用