Sammanfattning

Slutförd

Vi har slutfört vår introduktion till klassificering, så vi sammanfattar några viktiga punkter.

Vi såg att klassificeringen har mycket gemensamt med klassisk regression. För båda kan vi använda övervakad inlärning, en kostnadsfunktion och använda test- och träningsdatauppsättningar för att uppskatta verkliga prestanda. Vi fokuserade här på logistisk regression, som nästan är en hybrid mellan dessa två typer av modeller, och visade hur tröskelvärdet för utdata ger oss en kategorisk etikett, som avalanche/no-avalanche.

Vi diskuterade hur det kan vara lite svårare att utvärdera klassificeringsmodeller än med regressionsmodeller, särskilt eftersom de kostnader som ingår ofta är ointuitiva.

Vi har också utforskat hur tillägg och kombination av funktioner kan leda till omfattande modellförbättringar. Viktigt är att vi visade hur en grundlig reflektion över betydelsen av data är nyckeln till att uppnå det bästa resultatet.

I den här modulen arbetade vi med logistisk regression. Men kom ihåg att de flesta ämnen som vi har gått igenom här även gäller för många andra typer av klassificeringsmodeller. Inklusive modeller som försöker förutsäga fler än två möjliga kategorier.