使用 Databricks 模型服務自動查詢特徵
模型服務可以自動從已發佈的線上存放區或線上資料表中查找特徵值。 如需有關建立和使用線上資料表的詳細資料,請參閱使用線上資料表提供即時特徵服務。
需求
- 模型必須使用
FeatureEngineeringClient.log_model
(用於 Unity Catalog 中的特徵工程)或FeatureStoreClient.log_model
(適用於舊版工作區功能存放區)進行記錄,並且模型需要版本 v0.3.5 或更高版本。 - 對於第三方線上商店,必須以唯讀認證來發佈該商店。
注意
您可以在模型部署前 (包括模型訓練後) 隨時發佈特徵資料表。
自動功能查找
Azure Databricks 模型服務支援從這些線上存放區自動查詢特徵:
- Databricks 線上資料表
- Azure Cosmos DB (v0.5.0 和更新版本)
支援自動查詢特徵的資料類型如下:
IntegerType
FloatType
BooleanType
StringType
DoubleType
LongType
TimestampType
DateType
ShortType
DecimalType
ArrayType
MapType
覆寫線上模型評分中的特徵值
模型所需的所有特性 (以 FeatureEngineeringClient.log_model
或 FeatureStoreClient.log_model
登錄) 將自動從線上存放區中查取,用於模型評分。 若要在使用 REST API 和模型服務為模型評分時覆寫特徵值,請將這些特徵值包含於 API 承載中。
注意
新的特徵值必須符合基礎模型預期的特徵資料類型。
將增強型 DataFrame 儲存在推斷數據表中
針對從 2025 年 2 月起建立的端點,您可以設定一個模型服務端點,以記錄增強的 DataFrame,其中包含查閱的特徵值和函數返回值。 DataFrame 會儲存到提供的模型的推論表中。
如需設定此組態的指示,請參閱 記錄功能查找 DataFrame 以推斷至資料表。
如需推斷數據表的相關信息,請參閱 推斷數據表,以監視和偵錯模型。
筆記本範例:Unity Catalog
使用 Databricks Runtime 13.3 LTS 和更高版本時,Unity Catalog 中具有主鍵的任何 Delta 資料表都可以用作特徵資料表。 當您使用在 Unity Catalog 中註冊的資料表作為特徵資料表時,所有 Unity Catalog 功能都將自動提供給特徵資料表。
下列筆記本說明如何將特徵發佈至線上資料表,以進行即時服務和自動化特徵查詢。
線上表格示範筆記本
此範例筆記本說明如何將特徵發佈至線上存放區,然後提供可自動從線上存放區查詢特徵的已訓練模型。
協力廠商線上商店範例筆記本 (Unity Catalog)
筆記本範例:工作區功能存放區(舊版)
此範例筆記本說明如何將特徵發佈至線上存放區,然後提供可自動從線上存放區查詢特徵的已訓練模型。