AutoML Feature Store の統合
AutoML では、元の入力データセットを、Unity カタログまたは workspace 機能ストアの機能テーブルの機能を使用して拡張できます。
要件
- 分類と回帰の実験には、Databricks Runtime 11.3 LTS ML 以降が必要です。
- 予測実験には、Databricks Runtime 12.2 LTS ML 以降が必要です。
AutoML UI を使用して機能テーブルを選択する
AutoML 実験を構成したら、次の手順を使用して特徴量テーブルを選択できます。
[Join features (optional)](特徴の結合 (省略可能)) をクリックします。
[ 追加機能の結合 ページで、 Feature テーブル フィールドでフィーチャ テーブルを選択します。
特徴テーブルの主キーごとに、対応する参照キーを選択します。 参照キーは、AutoML 実験に指定したトレーニング データセット内の列である必要があります。
時系列特徴テーブルの場合は、対応するタイムスタンプ参照キーを選択します。 同様に、タイムスタンプ参照キーは、AutoML 実験に指定したトレーニング データセット内の列である必要があります。
さらにフィーチャ テーブルを追加するには、[ 別のフィーチャ テーブルを追加 をクリックし、上記の手順を繰り返します。
AutoML API で機能テーブルを使用する
既存の機能テーブルを使用するには、AutoML 実行仕様でfeature_store_lookups
パラメーターを設定。
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
次のノートブックは、AutoML で使用するために機能テーブルをトレーニング データセットに結合する方法を示しています。