Vad är maskininlärningsmodeller?

Slutförd

Modellen är kärnkomponenten i maskininlärning och i slutändan det vi försöker skapa. En modell kan uppskatta hur gammal en person är från ett foto, förutsäga vad du kanske vill se på sociala medier eller bestämma var en robotarm ska röra sig. I vårt scenario vill vi skapa en modell som kan uppskatta den bästa startstorleken för en hund baserat på deras selestorlek.

Modeller kan byggas på många sätt. Till exempel en traditionell modell som simulerar hur ett flygplan flyger byggs av människor, med hjälp av kunskaper i fysik och teknik. Maskininlärningsmodeller är speciella. i stället för att redigeras av personer så att de fungerar bra, formas maskininlärningsmodeller av data. De lär sig av erfarenhet.

Så här tänker du på modeller

Du kan se en modell som en funktion som accepterar data som indata och genererar utdata. Mer specifikt använder en modell indata för att uppskatta något annat. I vårt scenario vill vi till exempel skapa en modell som har fått en selestorlek och beräknar startstorleken:

Diagram som visar en modell utan parametrar.

Storlek på sele och hundstövlar är data. de är inte en del av modellen. Selestorlek är våra indata, hund boot storlek är utdata.

Modeller är ofta enkel kod

Modeller skiljer sig ofta inte meningsfullt från enkla funktioner som du redan är bekant med. Precis som med annan kod innehåller de logik och parametrar. Logiken kan till exempel multiplicera selestorleken med parameter_1:

Ett diagram som visar en modell med en enskild ospecificerad parameter.

Om parameter_1 här var 2,5 skulle vår modell multiplicera selestorleken med 2,5 och returnera resultatet:

Diagram som visar en modell med 2,5 som den enda parametern.

Välj en modell

Det finns många modelltyper, några enkla och några komplexa.

Precis som all kod är enklare modeller ofta de mest tillförlitliga och lätta att förstå, medan komplexa modeller potentiellt kan utföra imponerande prestationer. Vilken typ av modell du ska välja beror på ditt mål. Till exempel arbetar medicinska forskare ofta med modeller som är relativt enkla, eftersom de är tillförlitliga och intuitiva. Däremot förlitar sig AI-baserade robotar vanligtvis på komplexa modeller.

Det första steget i maskininlärning är att välja den typ av modell som du vill använda. Därför väljer vi en modell baserat på dess interna logik. Vi kan till exempel välja en modell med två parametrar för att uppskatta storleken på hundstarten från selestorleken:

Diagram som visar en modell med två ospecificerade parametrar.

Observera hur vi valde en modell baserat på hur den fungerar logiskt, men inte baserat på dess parametervärden. I det här läget har parametrarna faktiskt inte angetts till något visst värde.

Parametrar identifieras under träning

Den mänskliga designern väljer inte parametervärden. I stället anges parametervärdena till en första gissning och justeras sedan under en automatiserad inlärningsprocess som kallas träning.

Med tanke på vårt val av en modell med två parametrar börjar vi med att tillhandahålla slumpmässiga gissningar för våra parametrar:

Diagram som visar en modell med 0.2 och 1.2 som parametrar.

Dessa slumpmässiga parametrar innebär att modellen inte är bra på att uppskatta startstorleken, så vi utför träning. Under träningen ändras dessa parametrar automatiskt till två nya värden som ger bättre resultat:

Diagram som visar en modell med 1,5 och 4 som parametrar.

Exakt hur den här processen fungerar förklarar vi stegvis under hela din utbildningsresa.