Creare modelli di classificazione multiclasse

Completato

È anche possibile creare modelli di classificazione multiclasse, in cui sono presenti più di due classi possibili. Ad esempio, la clinica sanitaria potrebbe espandere il modello di diabete per classificare i pazienti come:

  • Non diabetici
  • Diabetici di tipo 1
  • Diabetici di tipo 2

I valori di probabilità delle singole classi verranno comunque aggiunti fino a un totale di 1 (in quanto il paziente si trova sicuramente in una sola delle tre classi) e la classe più probabile verrà prevista dal modello.

Uso di modelli di classificazione multiclasse

La classificazione multiclasse può essere pensata come una combinazione di più classificatori binari. Esistono due modi in cui è possibile affrontare il problema:

  • One vs Rest (OVR), in cui viene creato un classificatore per ogni possibile valore di classe, con un risultato positivo nei casi in cui la stima corrisponde a questa classe e stime negative nei casi in cui la stima corrisponde a un'altra classe. Un problema di classificazione con quattro possibili classi di forma (quadrato, cerchio, triangolo, esagono) richiederebbe ad esempio quattro classificatori che stimano:
    • quadrato o di altro tipo
    • cerchio o di altro tipo
    • triangolo o di altro tipo
    • esagono o di altro tipo
  • One vs One (OVO), in cui viene creato un classificatore per ogni possibile coppia di classi. Un problema di classificazione con quattro classi di forma richiederebbe invece i classificatori binari seguenti:
    • quadrato o cerchio
    • quadrato o triangolo
    • quadrato o esagono
    • cerchio o triangolo
    • cerchio o esagono
    • triangolo o esagono

In entrambi gli approcci, il modello generale deve prendere in considerazione tutte queste stime per determinare a quale categoria appartiene l'elemento.

Fortunatamente, nella maggior parte dei framework di Machine Learning, incluso scikit-learn, l'implementazione di un modello di classificazione multiclasse non è molto più complessa della classificazione binaria. Nella maggior parte dei casi, gli estimatori usati per la classificazione binaria supportano implicitamente la classificazione multiclasse astraendo un algoritmo OVR o un algoritmo OVO oppure consentendo di scegliere una delle due opzioni.