Tworzenie modeli klasyfikacji wieloklasowej

Ukończone

Istnieje również możliwość utworzenia modeli klasyfikacji wieloklasowej , w których istnieje więcej niż dwie możliwe klasy. Na przykład klinika zdrowia może rozszerzyć model cukrzycy, aby sklasyfikować pacjentów jako:

  • Bez cukrzycy
  • Cukrzyca typu 1
  • Cukrzyca typu 2

Pojedyncze wartości prawdopodobieństwa klasy nadal sumują się do sumy 1, ponieważ pacjent jest zdecydowanie w jednej z trzech klas, a najbardziej prawdopodobna klasa byłaby przewidywana przez model.

Używanie modeli klasyfikacji wieloklasowej

Klasyfikacja wieloklasowa może być uważana za kombinację wielu klasyfikatorów binarnych. Istnieją dwa sposoby podejścia do problemu:

  • Jeden vs REST (OVR), w którym klasyfikator jest tworzony dla każdej możliwej wartości klasy, z dodatnim wynikiem dla przypadków, w których przewidywanie jest tą klasą, i ujemne przewidywania dla przypadków, w których przewidywanie jest dowolną inną klasą. Na przykład problem klasyfikacji z czterema możliwymi klasami kształtów (kwadrat, okrąg, trójkąt, sześciokąt) wymaga czterech klasyfikatorów, które przewidują:
    • kwadrat lub nie
    • kółko lub nie
    • trójkąt lub nie
    • sześciokątne lub nie
  • Jeden vs jeden (OVO), w którym jest tworzony klasyfikator dla każdej możliwej pary klas. Problem klasyfikacji z czterema klasami kształtów wymaga następujących klasyfikatorów binarnych:
    • kwadrat lub okrąg
    • kwadrat lub trójkąt
    • kwadrat lub sześciokąt
    • okrąg lub trójkąt
    • okrąg lub sześciokąt
    • trójkąt lub sześciokąt

W obu podejściach ogólny model musi uwzględniać wszystkie te przewidywania, aby określić, do której kategorii należy dany element.

Na szczęście w większości platform uczenia maszynowego, w tym Scikit-Learn, implementacja modelu klasyfikacji wieloklasowej nie jest znacznie bardziej złożona niż klasyfikacja binarna — a w większości przypadków narzędzia do szacowania używane do klasyfikacji binarnej niejawnie obsługują klasyfikację wieloklasową przez abstrakcję algorytmu OVR, algorytmu OVO lub przez umożliwienie wyboru jednego z tych elementów.