Integración del Almacén de características de AutoML
AutoML puede aumentar el conjunto de datos de entrada original con características de tablas de características en el catálogo de Unity o en el almacén de características del área de trabajo.
Requisitos
- Los experimentos de clasificación y regresión requieren Databricks Runtime 11.3 LTS ML y versiones posteriores.
- Los experimentos de previsión requieren Databricks Runtime 12.2 LTS ML y versiones posteriores.
Selección de una tabla de características mediante la interfaz de usuario de AutoML
Después de configurar el experimento de AutoML, siga los pasos que se indican a continuación para seleccionar una tabla de características:
Haga clic en Combinar características (opcional).
En la página Combinar características adicionales, seleccione una tabla de características en el campo Tabla de características.
Para cada clave principal de la tabla de características, seleccione la clave de búsqueda correspondiente. La clave de búsqueda debe ser una columna del conjunto de datos de entrenamiento que proporcionó para el experimento de AutoML.
Para las tablas de características de serie temporal, seleccione la clave de búsqueda de marca de tiempo correspondiente. Del mismo modo, la clave de búsqueda de marca de tiempo debe ser una columna del conjunto de datos de entrenamiento que proporcionó para el experimento de AutoML.
Para agregar más tablas de características, haga clic en Agregar otra tabla de características y repita los pasos anteriores.
Uso de tablas de características con la API de AutoML
Para usar las tablas de características existentes, establezca el feature_store_lookups
parámetro en la especificación de ejecución de AutoML.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
En el cuaderno siguiente se muestra cómo unir tablas de características al conjunto de datos de entrenamiento para su uso con AutoML.