共用方式為


了解受管理的功能存放區中最上層實體

本文件說明受管理的功能存放區中最上層實體。

描述受管理的功能存放區主要元件的圖表。

如需 受管理的功能存放區 的詳細資訊,請瀏覽什麼是 受管理的功能存放區?資源。

功能存放區

您可以透過功能存放區建立及管理功能集。 功能集是功能的集合。 您可以選擇性地將具體化存放區(離線存放區連接)與功能存放區產生關聯,以定期預先計算和保存功能。 這種方法可以讓定型或推斷期間的功能擷取更快且更可靠。

如需設定的詳細資訊,請流覽 CLI (v2) 功能存放區 YAML 架構 資源。

實體

實體會封裝企業中邏輯實體的索引數據行。 實體的範例包括帳戶實體、客戶實體等。實體可協助強制執行在使用相同的邏輯實體的功能集上使用相同索引數據行定義的最佳作法。

實體通常會建立一次,然後跨功能集重複使用。 實體已建立版本。

如需設定的詳細資訊,請流覽 CLI (v2) 功能實體 YAML 架構 資源。

功能集規格和資產

功能集是針對來源系統數據套用轉換所產生的功能集合。 功能集會封裝來源、轉換函數和具體化設定。 我們目前支援 PySpark 功能轉換程式碼。

首先,建立功能集規格。 功能集規格是功能集的獨立定義,您可以在本機開發和測試。

功能集規格通常包含下列參數:

  • source:此功能對應至哪些來源
  • transformation (選擇性):套用至來源資料的轉換邏輯,用於建立功能。 在我們的案例中,則使用 Spark 作為支援的計算。
  • 代表 index_columnstimestamp_column 的資料行名稱:當使用者嘗試將功能資料與觀測資料聯結時,就需要這些名稱 (稍後會詳細介紹)
  • materialization_settings(選擇性):如果您想要快取具體化存放區中的特徵值,以有效率地擷取,則為必要專案。

在本機/開發環境中開發及測試功能集規格之後,您可以將規格註冊為功能存放區的功能集資產。 功能集資產提供受控功能,例如版本設定和具體化。

如需功能集 YAML 規格的詳細資訊,請造訪 CLI (v2) 功能集規格 YAML 架構 資源。

功能擷取規格

特徵擷取規格是與模型相關聯的功能清單可攜式定義。 該規格有助於簡化機器學習模型的開發和操作。 功能擷取規格通常是定型管線的輸入。 其有助於產生定型資料, 您可以使用模型來封裝它。 此外,推斷步驟會使用它來查閱功能。 其整合了機器學習生命週期的所有階段。 當您進行實驗和部署時,可以最大限度地減少定型和推斷管線的變更。

您可自行選擇是否使用功能擷取規格和內建功能擷取元件。 如有需要,您可以直接使用 get_offline_features() API。

如需功能擷取 YAML 規格的詳細資訊,請流覽 CLI (v2) 功能擷取規格 YAML 架構 資源。

下一步