Introduzione

Completato

In Machine Learning i modelli vengono sottoposti a training per stimare etichette sconosciute per i nuovi dati in base alle correlazioni tra etichette note e funzionalità presenti nei dati di training. A seconda dell'algoritmo usato, potrebbe essere necessario specificare iperparametri per configurare la modalità di training del modello.

Ad esempio, l'algoritmo regressione logistica usa un tasso di regolarizzazione iperparametro per contrastare l'overfitting; e tecniche di deep learning per reti neurali convoluzionali (CNN) usano iperparametri come tasso di apprendimento per controllare il modo in cui i pesi vengono regolati durante il training e dimensione batch per determinare il numero di elementi di dati inclusi in ogni batch di training.

Nota

Machine Learning è un campo accademico con una terminologia specifica. I data scientist fanno riferimento ai valori determinati dalle funzionalità di training come parametri , quindi è necessario un termine diverso per i valori usati per configurare il comportamento di training, ma che non sono derivati dai dati di training, quindi il termine iperparametri.

La scelta dei valori degli iperparametri può influire significativamente sul modello risultante, rendendo importante selezionare i valori migliori possibili per i dati specifici e gli obiettivi di prestazioni predittivi.

Ottimizzazione degli iperparametri

Diagramma di valori iperparametri diversi che generano modelli diversi eseguendo l'ottimizzazione degli iperparametri.

l'ottimizzazione degli iperparametri viene eseguita eseguendo il training di più modelli, usando lo stesso algoritmo e gli stessi dati di training, ma valori iperparametri diversi. Il modello risultante da ogni esecuzione di training viene quindi valutato per determinare la metrica delle prestazioni per cui si vuole ottimizzare (ad esempio, 'accuratezza) e viene selezionato il modello con prestazioni migliori.

In Azure Machine Learning è possibile ottimizzare gli iperparametri inviando uno script come processo di sweep. Un compito di sweep eseguirà una prova per ogni combinazione di iperparametri da testare. Ogni prova impiega uno script di addestramento con valori di iperparametri per allenare un modello e registra la metrica di performance obiettivo raggiunta dal modello addestrato.

Obiettivi di apprendimento

In questo modulo si apprenderà come:

  • Definire uno spazio di ricerca degli iperparametri.
  • Configurare il campionamento degli iperparametri.
  • Selezionare un criterio di terminazione anticipata.
  • Eseguire un'attività di scansione.