個人化工具自動最佳化 (預覽)

發行項
09/03/2024

重要

從 2023 年 9 月 20 日起，您將無法建立新的個人化工具資源。個人化工具服務將於 2026 年 10 月 1 日淘汰。

簡介

個人化工具自動最佳化可節省您的人工，藉由自動搜尋改良的學習設定，將其用來訓練您的模型並加以套用，將個人化工具迴圈保持在最佳的機器學習效能。個人化工具具有嚴格準則，可套用新的學習設定，以確保改善項目不會造成獎勵降低。

個人化工具自動最佳化處於公開預覽狀態，而其功能、方法和流程將根據使用者意見反應而變更。

何時使用自動最佳化

在大多數情況下，最佳選項是開啟自動最佳化。新個人化工具迴圈的預設值為自動最佳化開啟。

在下列情況，自動最佳化可有所幫助：

您所建立的應用程式將由許多租用戶使用，而且每個租用戶都會取得自己的個人化工具迴圈；例如，如果您裝載多個電子商務網站。自動最佳化可讓您在需要調整大量個人化工具迴圈的學習設定時，避免手動工作。
您已部署個人化工具並驗證其是否正常運作、取得良好的獎勵，且確定您的功能沒有任何錯誤或問題。

注意

自動最佳化會定期覆寫個人化工具學習設定。如果您的使用案例或產業需要審核並封存模型與設定，或者您需要備份先前的設定，則可以使用個人化工具 API 來擷取學習設定，或透過 Azure 入口網站下載這些檔案。

如何啟用和停用自動最佳化

若要啟用自動最佳化，請在 Azure 入口網站中使用 [模型和學習設定] 刀鋒視窗中的切換開關。

或者，您可以使用個人化工具 /configurations/service API 來啟用自動最佳化。

若要停用自動最佳化，請關閉切換開關。

自動最佳化報表

在 [模型和學習設定] 刀鋒視窗中，您可以看到自動最佳化執行的歷程記錄，以及每個執行的動作。

表格顯示：

當自動最佳化執行發生時，
包含的資料視窗，
線上、基準和最佳學習設定的獎勵效能，
採取的動作：如果學習設定已更新。

每個自動最佳化歷程記錄資料列中，不同學習設定的獎勵效能會以絕對數字顯示，並會以相對於基準效能的百分比顯示。

範例：如果基準平均獎勵估計為 0.20，且線上個人化工具行為達到 0.30，則兩者會分別顯示為 100% 和 150%。如果自動最佳化找到能夠達到 0.40 平均獎勵的學習設定，則會顯示為 200% (0.40 為 0.20 的 200%)。假設信賴邊界允許，則會套用新的設定，然後在下一次執行之前，將個人化工具以線上設定的形式驅動。

系統會保留最多 24 個先前自動最佳化執行的歷程記錄，以供您分析。您可以深入瞭解這些離線評估和報表的詳細資料。此外，報表也包含此歷程記錄中的任何學習設定，您可以尋找並下載或套用。

運作方式

個人化工具會根據獎勵不斷地訓練其使用的 AI 模型。這項訓練會依照部分學習設定來完成，其中包含用於訓練程式的超參數和其他值。這些學習設定可以「微調」至您的特定個人化工具實例。

個人化工具也可以執行離線評估。離線評估會查看過去的資料，而且可針對個人化工具不同演算法和模型所能達到的平均獎勵，產生統計估計。在此流程期間，個人化工具也會搜尋更好的學習設定，並評估其效能 (在過去一段期間內，得到多少獎勵)。

自動最佳化頻率

自動最佳化會定期執行，並根據過去的資料執行自動最佳化

如果您的應用程式在過去兩周內，傳送到個人化工具的資料超過約 20 Mb，則會使用過去兩周的資料。
如果您的應用程式傳送資料小於此數量，個人化工具會在取得足夠的資料以進行最佳化之前，或在達到最早儲存的資料 (其上限為資料保留的天數) 為止，繼續從過去的天數新增資料。

自動最佳化執行的確切時間和天數取決於個人化工具服務，而且會隨著時間波動。

更新學習設定的準則

個人化工具會使用這些獎勵估計來決定是否要為其他人變更目前的學習設定。每個估計都是一個分佈曲線，其具有上限和下限 95% 的信賴範圍。個人化工具只會在下列情況套用新的學習設定：

其在評估期間顯示較高的平均報酬率，「並且」
其信賴區間下限低於 95%，高於線上學習設定的 95% 信賴區間下限。此準則可將獎勵改進最大化，同時嘗試消除未來報酬率的機率，其是由個人化工具所管理，並以 Seldonian 演算法和 AI 安全性的研究來進行繪製。

自動最佳化的限制

個人化工具自動最佳化會依賴過去期間的評估，以評估未來的效能。有可能因世界上的外部因素、您的應用程式和使用者，導致這些在過去時期完成的個人化工具模型估計和預測無法代表未來。

個人化工具迴圈若啟用多位置個人化 API 預覽功能，則無法使用自動最佳化預覽。

共用方式為