Integratie van AutoML Feature Store
AutoML kan de oorspronkelijke invoergegevensset uitbreiden met kenmerken uit kenmerktabellen in Unity Catalog of in het verouderde Werkruimte Kenmerkenarchief.
Vereisten
- Voor classificatie- en regressieexperimenten is Databricks Runtime 11.3 LTS ML en hoger vereist.
- Voor prognoseexperimenten is Databricks Runtime 12.2 LTS ML en hoger vereist.
Een functietabel selecteren met behulp van de AutoML-gebruikersinterface
Nadat u uw AutoML-experiment hebt geconfigureerd, kunt u een tabel met functies selecteren met behulp van de volgende stappen:
Klik op Join-functies (optioneel).
Selecteer op de pagina Aanvullende functies toevoegen een functietabel in het veld Functietabel .
Selecteer voor elke primaire sleutel van de functietabel de bijbehorende opzoeksleutel. De zoeksleutel moet een kolom zijn in de trainingsgegevensset die u hebt opgegeven voor uw AutoML-experiment.
Voor tijdreeksfunctietabellen selecteert u de bijbehorende tijdstempelzoeksleutel. Op dezelfde manier moet de zoeksleutel voor tijdstempels een kolom zijn in de trainingsgegevensset die u hebt opgegeven voor uw AutoML-experiment.
Als u meer functietabellen wilt toevoegen, klikt u op Nog een functietabel toevoegen en herhaalt u de bovenstaande stappen.
Functietabellen gebruiken met de AutoML-API
Als u bestaande functietabellen wilt gebruiken, stelt u de feature_store_lookups
parameter in uw AutoML-uitvoeringsspecificatie in.
feature_store_lookups = [
{
"table_name": "example.trip_pickup_features",
"lookup_key": ["pickup_zip", "rounded_pickup_datetime"],
},
{
"table_name": "example.trip_dropoff_features",
"lookup_key": ["dropoff_zip", "rounded_dropoff_datetime"],
}
]
In het volgende notebook ziet u hoe u functietabellen koppelt aan uw trainingsgegevensset voor gebruik met AutoML.