Databricksの機能エンジニアリングとレガシー ワークスペース フィーチャー ストアに関するリリースノート
このページには、Unity Catalog クライアントの Databricks Feature Engineering と Databricks Workspace Feature Store クライアントのリリースが一覧表示されます。 どちらのクライアントも PyPI で、databricks-feature-engineering として使用できます。
ライブラリは次のような目的で使用されます。
- 特徴tablesの作成、読み取り、書き込みを行う。
- 特徴量データでモデルをトレーニングします。
- オンライン ストアに機能 tables を公開して、リアルタイムサービスを提供します。
使用法のドキュメントについては、「Databricks Feature Store」を参照してください。 Python API のドキュメントについては、「Python API」を参照してください。
Unity Catalog クライアントのフィーチャー エンジニアリングは、Unity Catalogの機能と機能 tables に対して機能します。 ワークスペース フィーチャー ストア クライアントは、ワークスペース フィーチャー ストアの機能と機能 tables に対して機能します。 いずれのクライアントも Databricks Runtime for Machine Learning にプレインストールされています。 これらのクライアントは、PyPI (databricks-feature-engineering
) から pip install databricks-feature-engineering
をインストールした後、Databricks Runtime でも実行できます。 単体テストの場合にのみ、両方のクライアントはローカルまたは CI/CD 環境で使用できます。
Databricks Runtime および Databricks Runtime ML バージョンとのクライアント バージョンの互換性を示す table については、「Feature Engineering compatibility matrix」を参照してください。 Databricks ワークスペース Feature Store クライアントの古いバージョンは、PyPI で databricks-feature-store として使用できます。
databricks-feature-engineering 0.8.0
score_batch
呼び出しでのparams
の使用をサポートします。これにより、推論のために追加の parameters をモデルに渡すことができます。- バグの修正と機能強化
databricks-feature-engineering 0.7.0
- Unity Catalog の特定の views を、オフライン モデルのトレーニングと評価の機能 tables として使用できるようになりました。 「Unity Catalog の特徴tableから読み取る」を参照してください。
- トレーニング セットは、機能参照または機能スペックを使用して作成できるようになりました。 Python SDK リファレンスを参照してください。
databricks-feature-engineering 0.6.0
- Tempo での既存のサポートに加えて、ネイティブ Spark でのポイントインタイム結合の実行がサポートされるようになりました。 アイデアを提案してくれた Semyon Sinchenko に感謝します。
StructType
が PySpark データ型としてサポートされるようになりました。StructType
はオンライン提供ではサポートされていません。write_table
は、液体クラスタリング が有効になっている tables への書き込みをサポートしています。timeseries_columns
のcreate_table
パラメーターの名前がtimeseries_column
に変更されました。 既存のワークフローでは、引き続きtimeseries_columns
パラメーターを使用できます。score_batch
ではenv_manager
パラメーターがサポートされるようになりました。 詳細については MLflow のドキュメントを参照してください。
databricks-feature-engineering 0.5.0
- ユーザーが Unity Catalog の FeatureSpec の所有者をupdateできるようにする
databricks-feature-engineering
の新しい APIupdate_feature_spec
です。
databricks-feature-engineering 0.4.0
- 小さなバグ修正と機能強化。
databricks-feature-engineering 0.3.0
log_model
では、新しい databricks-feature-lookup PyPI パッケージが使用されるようになりました。ここでは、オンライン モデル サービスのパフォーマンスが向上しています。
databricks-feature-store 0.17.0
databricks-feature-store
は非推奨とされます。 このパッケージ内のすべての既存モジュールは、databricks-feature-engineering
のバージョン 0.2.0 以上で使用できます。 詳しくは、「Python API」をご覧ください。
databricks-feature-engineering 0.2.0
databricks-feature-engineering
にはdatabricks-feature-store
からのすべてのモジュールが含まれるようになりました。 詳しくは、「Python API」をご覧ください。
databricks-feature-store 0.16.3
- 機能 tablesで AutoML を使用するときのタイムアウトバグを修正しました。
databricks-feature-engineering 0.1.3
- UpgradeClient の小さな機能強化。
databricks-feature-store 0.16.2
- これで Feature Serving および Function Serving エンドポイントを作成できるようになりました。 詳細については、「Feature Serving および Function Serving」を参照してください。
databricks-feature-store 0.16.1
- 小さなバグ修正と機能強化。
databricks-feature-engineering 0.1.2 および databricks-feature-store 0.16.0
- 小さなバグ修正と機能強化。
- 特定のワークスペースのセットアップと共にログに記録される不適切なジョブ系列 URL を修正しました。
databricks-feature-engineering 0.1.1
- 小さなバグ修正と機能強化。
databricks-feature-engineering 0.1.0
- Unity Catalog Python クライアントの Feature Engineering のGAリリースが PyPI に公開されました。
databricks-feature-store 0.15.1
- 小さなバグ修正と機能強化。
databricks-feature-store 0.15.0
- モデルをログに記録する際に、入力例を自動的に推論してログに記録することができるようになりました。 これを行うには、
log_model
を呼び出す際にinfer_model_example
をTrue
にsetします。 その例は、training_set
パラメータ内で指定されたトレーニング データに基づきます。
databricks-feature-store 0.14.2
- MariaDB Connector/J >=2.7.5 から Aurora MySQL に発行する際のバグを修正しました。
databricks-feature-store 0.14.1
- 小さなバグ修正と機能強化。
databricks-feature-store 0.14.0
0.14.0 以降では、primary_keys
引数にタイムスタンプ キー columns を指定する必要があります。 タイムスタンプ キーは、機能 tableの各行を一意に識別する "主キー" の一部です。 他の主キー columnsと同様に、タイムスタンプ キー columns には NULL valuesを含めることはできません。
次の例では、DataFrame user_features_df
には、user_id
、ts
、purchases_30d
、および is_free_trial_active
の columnsが含まれています。
0.14.0 以降
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 以前
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- 小さなバグ修正と機能強化。
databricks-feature-store 0.13.0
- 最低限必要な
mlflow-skinny
バージョンは、現在 2.4.0 です。 - 指定された DataFrame に必要なすべての参照キーが含まれていない場合、トレーニング set の作成は失敗します。
- Unity Catalogで機能 tables を使用するモデルをログに記録すると、MLflow 署名がモデルと共に自動的にログに記録されます。
databricks-feature-store 0.12.0
drop_online_table
API を使用してオンライン ストアを削除できるようになりました。
databricks-feature-store 0.11.0
- Unity Catalog対応ワークスペースにおいて、ワークスペースと Unity Catalog 機能 tables の両方を Cosmos DB オンラインストアに発行できるようになりました。 これには、Databricks Runtime 13.0 ML 以上が必要です。
databricks-feature-store 0.10.0
- 小さなバグ修正と機能強化。
databricks-feature-store 0.9.0
- 小さなバグ修正と機能強化。
databricks-feature-store 0.8.0
- 小さなバグ修正と機能強化。
databricks-feature-store 0.7.1
flask
でモデルをスコアリングする際に不足している依存関係の問題を修正するために、score_batch
を依存関係として追加します。
databricks-feature-store 0.7.0
- 小さなバグ修正と機能強化。
databricks-feature-store 0.6.1
- Databricks Feature Store クライアントの PyPI への初期公開リリース。