Интеграция с Хранилищем компонентов AutoML
AutoML может расширить исходный входной набор данных с функциями из таблиц компонентов в каталоге Unity или в хранилище функций рабочей области.
Требования
- Для экспериментов классификации и регрессии требуется Databricks Runtime 11.3 LTS ML и более поздних версий.
- Для экспериментов прогнозирования требуется Databricks Runtime 12.2 LTS ML и более поздних версий.
Выбор таблицы компонентов с помощью пользовательского интерфейса AutoML
После настройки эксперимента AutoML можно выбрать таблицу функций, выполнив следующие действия.
Нажмите кнопку "Присоединиться" (необязательно).
На странице "Присоединение к дополнительным функциям" выберите таблицу компонентов в поле "Таблица компонентов".
Для каждой таблицы компонентов первичный ключ выберите соответствующий ключ подстановки. Ключ подстановки должен быть столбцом в обучаемом наборе данных, предоставленном для эксперимента AutoML.
Для таблиц функций временных рядов выберите соответствующий ключ подстановки времени. Аналогичным образом ключ подстановки времени должен быть столбцом в обучаемом наборе данных, предоставленном для эксперимента AutoML.
Чтобы добавить дополнительные таблицы функций, нажмите кнопку "Добавить другую таблицу функций" и повторите описанные выше действия.
Использование таблиц функций с API AutoML
Чтобы использовать существующие таблицы компонентов, задайте feature_store_lookups
параметр в спецификации запуска AutoML.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
В следующей записной книжке показано, как присоединить таблицы компонентов к набору обучающих данных для использования с AutoML.