Den här webbläsaren stöds inte längre.
Uppgradera till Microsoft Edge och dra nytta av de senaste funktionerna och säkerhetsuppdateringarna, samt teknisk support.
Varför rensar vi våra data innan träningen?
Om du tar bort rader med data blir vår modell mer kraftfull.
Genom att rensa data kan vi välja funktioner som hjälper modellens prestanda.
Om du tar bort rader med fel kan dessa rader inte vilseleda träningsprocessen.
Vilken typ av data kodas bäst med en frekventa vektorer?
Ordningsdata
Kategoridata med två möjliga värden
Kategoriska data med tre eller fler värden
Vad är ett dataexempel? Vad är en befolkning?
Ett exempel är alla möjliga data som vi bryr oss om. En population är delmängden av dessa data som vi faktiskt har till hands.
Både population och exempel refererar till data som vi använder för att träna vår modell.
En population är alla möjliga data som vi bryr oss om. Ett exempel är delmängden av de data som vi faktiskt har till hands.
Du har en modell som inte fungerar bra. Vilket av dessa alternativ bidrar definitivt inte till att förbättra dess prestanda?
Lägga till fler exempel (rader).
Att lägga till några funktioner (kolumner) som du vet relaterar till vad modellen försöker förutsäga.
Att lägga till ett stort antal funktioner som du vet inte har någon relation till vad modellen försöker förutsäga.
Du måste svara på alla frågor innan du kontrollerar ditt arbete.
Var den här sidan till hjälp?