Integração com o AutoML Feature Store
O AutoML pode aumentar o conjunto de dados de entrada original com recursos de tabelas de recursos no Unity Catalog ou no Workspace Feature Storeherdado.
Requisitos
- Os experimentos de classificação e regressão exigem o Databricks Runtime 11.3 LTS ML e superior.
- Os experimentos de previsão exigem o Databricks Runtime 12.2 LTS ML e superior.
Selecione uma tabela de recursos usando a interface do usuário AutoML
Depois de configurar seu experimento AutoML, você pode selecionar uma tabela de recursos usando as seguintes etapas:
Clique em Participar de recursos (opcional).
Na página Ingressar em recursos adicionais, selecione uma tabela de recursos no campo Tabela de Recursos.
Para cada chave primária da tabela de recursos, selecione a chave de pesquisa correspondente. A chave de pesquisa deve ser uma coluna no conjunto de dados de treinamento que você forneceu para seu experimento AutoML.
Para tabelas de recursos de séries temporais, selecione a chave de pesquisa de carimbo de data/hora correspondente. Da mesma forma, a chave de pesquisa de carimbo de data/hora deve ser uma coluna no conjunto de dados de treinamento fornecido para seu experimento AutoML.
Para adicionar mais tabelas de recursos, clique em Adicionar outra tabela de recursos e repita as etapas acima.
Usar tabelas de recursos com a API AutoML
Para usar tabelas de recursos existentes, defina o parâmetro na especificação feature_store_lookups
de execução do AutoML.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
O bloco de anotações a seguir mostra como unir tabelas de recursos ao seu conjunto de dados de treinamento para uso com o AutoML.