Introduktion

Slutförd

Regression är en enkel, vanlig och mycket användbar dataanalysteknik, som i vardagligt fall kallas "anpassning av en trendlinje". Regression identifierar styrkan i relationen mellan en eller flera funktioner och en enda etikett. Dess enkelhet, förutsägbara beteende, förmåga att förutse och hög tolkningsnivå innebär att denna teknik används inom ekonomi, näringsliv, samhällsvetenskap, epidemiologi och medicin.

I den här modulen tar vi en djupare titt på hur regression fungerar, förstår dess begränsningar och lär dig hur du utvärderar dess prestanda.

Scenario: Överkörning av veterinärklinik

I den här modulen använder vi följande exempelscenario för att förklara begreppen bakom regression. Det här scenariot är utformat för att ge ett exempel på hur du kan använda den här tekniken när du analyserar framtida data.

Den lavinräddningshund välgörenhet du driver har haft en plötslig våg av sjukdom. Efter en dag av omträning och vissa sociala aktiviteter har många hundar du arbetar med fallit sjuka, det viktigaste symptomet är feber (förhöjd kroppstemperatur). Orolig för de hundar som ännu inte har presenterats med symtom, har ditt team samlat grundläggande information om de första 100 hundarna som insjuknade. Ditt jobb är att identifiera vilka typer av hundar som har högre risk för sjukdom, så att de kan kontrolleras proaktivt av veterinären.

Utbildningsmål

I den här modulen kommer du att:

  • Förstå hur regression fungerar.
  • Arbeta med nya algoritmer: Linjär regression, flera linjär regression och polynomregression.
  • Förstå regressionsmodellernas styrkor och begränsningar.
  • Visualisera fel- och kostnadsfunktioner i linjär regression.
  • Förstå grundläggande utvärderingsmått för regression.

Förutsättningar

  • Kunskaper om maskininlärningsmodeller