Introduzione

Completato

In ambito apprendimento automatico gli algoritmi vengono usati per eseguire il training di modelli che prevedono le etichette sconosciute per i nuovi dati in base alle correlazioni tra etichette note e le caratteristiche trovate nei dati di training. A seconda dell'algoritmo usato, può essere necessario specificare gli iperparametri per configurare la modalità di training del modello. Ad esempio, l'algoritmo di regressione logistica usa un iperparametro relativo al tasso di regolarizzazione per contrastare l'overfitting, mentre i modelli di reti neurali di Deep Learning usano iperparametri come la velocità di apprendimento per controllare come vengono modificati i pesi durante il training.

Nota

Machine Learning è un campo accademico con una terminologia specifica. I data scientist fanno riferimento ai valori determinati dalle funzionalità di training come parametri, quindi è necessario un termine diverso per i valori usati per configurare il comportamento di training, ma che non sono derivati dai dati di training, quindi il termine iperparametri.

I valori degli iperparametri selezionati per un determinato algoritmo possono avere un effetto significativo sul modello di cui viene eseguito il training; quindi la scelta dei valori degli iperparametri giusti può fare la differenza tra un modello che genera previsioni accurate se usato con nuovi dati e un modello che non soddisfa questo requisito.

In Azure Databricks è possibile usare la libreria Hyperopt per automatizzare l'ottimizzazione degli iperparametri; si tratta di un processo in cui si eseguono ripetutamente il training e la valutazione dei modelli usando combinazioni diverse di iperparametri fino a trovare i valori ottimali per i dati.