AutoML 功能存储集成

AutoML 可以使用 Unity Catalog 中的 特征表或 旧工作区特征存储中的特征来增强原始输入数据集。

要求

  • 分类和回归试验需要 Databricks Runtime 11.3 LTS ML 及更高版本。
  • 预测试验需要 Databricks Runtime 12.2 LTS ML 及更高版本。

使用 AutoML UI 选择功能表

配置 AutoML 试验后,可以使用以下步骤选择特征表:

  1. 单击“加入特征(可选)”。

    选择“加入特征”按钮

  2. 在“联接其他功能”页上,在“功能表”字段中选择一个功能表

  3. 对于每个特征表主键,选择相应的查找键。 查找键应该是为 AutoML 试验提供的训练数据集中的列。

  4. 对于时序特征表,请选择相应的时间戳查找键。 同样,时间戳查找键应该是为 AutoML 试验提供的训练数据集中的列。

    选择主键和查找表

  5. 若要添加更多功能表,请单击“ 添加其他功能表 ”并重复上述步骤。

将功能表与 AutoML API 配合使用

若要使用现有功能表,请在 feature_store_lookups AutoML 运行规范设置参数。

feature_store_lookups = [
  {
     "table_name": "example.trip_pickup_features",
     "lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
  },
  {
      "table_name": "example.trip_dropoff_features",
     "lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
  }
]

以下笔记本演示如何将功能表联接到训练数据集,以便与 AutoML 一起使用。

使用功能表笔记本的 AutoML 试验

获取笔记本