Riepilogo
L'introduzione alla classificazione è stata completata, quindi è ora possibile riepilogare alcuni punti chiave.
Si è visto che la classificazione ha molto in comune con la regressione classica. In entrambi i casi è possibile usare l'apprendimento supervisionato, una funzione di costo, nonché set di dati di test ed training per stimare le prestazioni reali. In questo modulo è stata trattata in particolare la regressione logistica, che è quasi un ibrido tra questi due tipi di modello ed è stato spiegato che definire una soglia per l'output consente di ottenere un'etichetta di categoria, ad esempio avalanche
/no-avalanche
.
È stato illustrato come la valutazione dei modelli di classificazione possa essere leggermente più complessa rispetto a quella dei modelli di regressione, in particolare perché le funzioni di costo coinvolte sono spesso poco intuitive.
È stato anche spiegato che l'aggiunta e la combinazione di caratteristiche possono apportare miglioramenti sostanziali al modello. In particolare, è stato sottolineato che riflettere sull'effettivo significato dei dati sia di fondamentale importanza per ottenere il miglior risultato.
In questo modulo si è lavorato con la regressione logistica. Ma tenere presente che la maggior parte degli argomenti trattati qui si applica anche a molti altri tipi di modelli di classificazione. Inclusi i modelli che tentano di stimare più di due possibili categorie.