功能控管和譜系
此頁面描述 Unity Catalog中特徵工程的治理和譜系功能。
如需監視服務模型效能和功能 table 資料變更的相關信息,請參閱 Lakehouse Monitoring。
控制功能 tables 的存取
Unity Catalog 中功能 tables 的訪問控制是由 Unity Catalog管理。 請參閱 Unity Catalog 許可權。
檢視特性 table、函式以及模型譜系
當您使用 FeatureEngineeringClient.log_model
記錄模型時,模型中使用的特徵會自動追蹤,而且可以在 [Catalog 瀏覽器] 的 [歷程] 標籤中檢視。 除了功能 tables之外,也會追蹤用於計算按需功能的 Python UDF。
如何擷取特徵的譜系 table、函式或模型
當您呼叫 log_model
時,模型中使用的譜系資訊追蹤功能 tables 和函式會自動被擷取。 請參閱下列範例程序代碼。
from databricks.feature_engineering import FeatureEngineeringClient, FeatureLookup, FeatureFunction
fe = FeatureEngineeringClient()
features = [
FeatureLookup(
table_name = "main.on_demand_demo.restaurant_features",
feature_names = ["latitude", "longitude"],
rename_outputs={"latitude": "restaurant_latitude", "longitude": "restaurant_longitude"},
lookup_key = "restaurant_id",
timestamp_lookup_key = "ts"
),
FeatureFunction(
udf_name="main.on_demand_demo.extract_user_latitude",
output_name="user_latitude",
input_bindings={"blob": "json_blob"},
),
FeatureFunction(
udf_name="main.on_demand_demo.extract_user_longitude",
output_name="user_longitude",
input_bindings={"blob": "json_blob"},
),
FeatureFunction(
udf_name="main.on_demand_demo.haversine_distance",
output_name="distance",
input_bindings={"x1": "restaurant_longitude", "y1": "restaurant_latitude", "x2": "user_longitude", "y2": "user_latitude"},
)
]
training_set = fe.create_training_set(
label_df, feature_lookups=features, label="label", exclude_columns=["restaurant_id", "json_blob", "restaurant_latitude", "restaurant_longitude", "user_latitude", "user_longitude", "ts"]
)
class IsClose(mlflow.pyfunc.PythonModel):
def predict(self, ctx, inp):
return (inp['distance'] < 2.5).values
model_name = "fe_packaged_model"
mlflow.set_registry_uri("databricks-uc")
fe.log_model(
IsClose(),
model_name,
flavor=mlflow.pyfunc,
training_set=training_set,
registered_model_name=registered_model_name
)
檢視特性 table、模型或函數的譜系
若要檢視功能 table、模型或函式的譜系,請遵循下列步驟:
在 Catalog Explorer 中導航至 table、模型版本或函式頁面。
Select [譜系] 標籤。左側欄位會顯示以這個 table、模型版本或函式記錄的 Unity Catalog 元件。
Explorer 裡的模型頁面「 歷程」標籤 點選 看譜系圖形。 譜系圖形隨即出現。 如需探索譜系圖的詳細資訊,請參閱 擷取和探索譜系。
若要關閉譜系圖形,請按下右上角 譜系圖形的關閉按鈕
。