Polynomregression

Slutförd

Hittills har vi bara tittat på linjära regressionsmodeller. modeller som kan modelleras som raka linjer. Regressionsmodeller kan dock fungera med praktiskt taget alla andra typer av relationer.

Vad är polynomregression?

Polynomregression modellerar relationer som en viss typ av kurva. Polynomer är en familj av kurvor, allt från enkla till komplexa former. Ju fler parametrar i ekvationen (modellen), desto mer komplex kan kurvan vara.

Till exempel är en polynom med två parametrar helt enkelt en rak linje:

y = skärningspunkt + B1*x

Diagram som visar ett polynomregressionsdiagram med två parametrar.

Medan en polynom med tre parametrar har en enda böj i sig:

y = skärningspunkt + B1*x + B2 * x2

Diagram som visar ett polynomregressionsdiagram med tre parametrar.

Och en polynom med fyra parametrar kan ha två böjar:

y = intercept + B1*x + B2 * x2 + B3 * x3

Diagram som visar ett polynomregressionsdiagram med fyra parametrar.

Polynom jämfört med andra kurvor

Det finns många typer av kurvor, till exempel loggkurvor och logistiska (s-formade) kurvor, som alla kan användas med regression.

Diagram som visar polynom-, logg- och logistikkurvor.

En stor fördel med polynomregression är att du kan använda den för att titta på alla typer av relationer. Du kan till exempel använda polynomregression för relationer som är negativa inom ett visst intervall av funktionsvärden, men positiva inom andra. Du kan också använda den där etiketten (y-värdet) inte har någon teoretisk övre gräns.

Diagram som visar polynom-, logg- och logistikkurvor med ritpunkter i polynomkurvan.

Den största nackdelen med polynomkurvor är att de ofta extrapolerar dåligt. Om vi med andra ord försöker förutsäga värden som är större eller mindre än våra träningsdata kan polynomer förutsäga orealistiskt extrema värden. En annan nackdel är att polynomkurvor är lätta att överanpassa. Det innebär att brus i data kan ändra formen på kurvan mycket mer än enklare modeller, till exempel enkel linjär regression.

Diagram som visar en felaktig polynomkurva med diagram.

Kan kurvor användas med flera funktioner?

Vi har sett hur flera regressioner kan passa flera linjära relationer samtidigt. Dessa behöver dock inte begränsas till linjära relationer. Kurvor av alla slag kan användas för dessa relationer när det är lämpligt. Även om du bör vara noga med att inte använda kurvor som polynomer med flera funktioner där de inte är nödvändiga. Det beror på att relationerna kan bli mycket komplexa, vilket gör det svårare att förstå modellerna och bedöma om de kommer att göra förutsägelser som inte är meningsfulla ur verklig synvinkel.