次の方法で共有


AutoML Feature Store の統合

AutoML では、元の入力データセットを、Unity カタログまたは workspace 機能ストアの機能テーブルの機能を使用して拡張できます。

要件

  • 分類と回帰の実験には、Databricks Runtime 11.3 LTS ML 以降が必要です。
  • 予測実験には、Databricks Runtime 12.2 LTS ML 以降が必要です。

AutoML UI を使用して機能テーブルを選択する

AutoML 実験を構成したら、次の手順を使用して特徴量テーブルを選択できます。

  1. [Join features (optional)](特徴の結合 (省略可能)) をクリックします。

    [Join features] (特徴の結合) ボタンの選択

  2. [ 追加機能の結合 ページで、 Feature テーブル フィールドでフィーチャ テーブルを選択します。

  3. 特徴テーブルの主キーごとに、対応する参照キーを選択します。 参照キーは、AutoML 実験に指定したトレーニング データセット内の列である必要があります。

  4. 時系列特徴テーブルの場合は、対応するタイムスタンプ参照キーを選択します。 同様に、タイムスタンプ参照キーは、AutoML 実験に指定したトレーニング データセット内の列である必要があります。

    主キーと参照キーの選択

  5. さらにフィーチャ テーブルを追加するには、[ 別のフィーチャ テーブルを追加 をクリックし、上記の手順を繰り返します。

AutoML API で機能テーブルを使用する

既存の機能テーブルを使用するには、AutoML 実行仕様でfeature_store_lookups パラメーターを設定

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

次のノートブックは、AutoML で使用するために機能テーブルをトレーニング データセットに結合する方法を示しています。

機能テーブル ノートブックを使用した AutoML 実験

ノートブックを入手