Integração com o AutoML Feature Store
O AutoML pode aumentar o conjunto de dados de entrada original com recursos de tabelas de recursos no Catálogo do Unity ou no repositório de recursos do workspace.
Requisitos
- Os experimentos de classificação e regressão exigem o Databricks Runtime 11.3 LTS ML e superior.
- Os experimentos de previsão exigem o Databricks Runtime 12.2 LTS ML e superior.
Selecionar uma tabela de recursos usando a interface do usuário do AutoML
Depois de configurar o experimento do AutoML, você pode selecionar uma tabela de recursos usando as seguintes etapas:
Clique em Unir recursos (opcional).
Na página Unir recursos adicionais, selecione uma tabela de recursos no campo Tabela de recursos.
Para cada Chave primária da tabela de recursos, selecione a chave de pesquisa correspondente. A chave de pesquisa deve ser uma coluna no conjunto de dados de treinamento que você forneceu para o experimento do AutoML.
Para tabelas de recursos de série temporal, selecione a chave de pesquisa de carimbo de data/hora correspondente. De forma semelhante, a chave de pesquisa do carimbo de data/hora deve ser uma coluna no conjunto de dados de treinamento que você forneceu para o experimento do AutoML.
Para adicionar mais tabelas de recursos, clique em Adicionar outra tabela de recursos e repita as etapas acima.
Usar tabelas de recursos com a API do AutoML
Para usar tabelas de recursos existentes, defina o parâmetro na especificação de execução do feature_store_lookups
AutoML.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
O notebook a seguir mostra como unir tabelas de recursos ao conjunto de dados de treinamento para uso com o AutoML.