Gør ydeevnen for din model til klassificering af kategorier bedre
Hvis modellens ydeevne ikke er, som du ønsker det, er der et par ting, du kan prøve. Disse tip kan hjælpe dig med at tilpasse din model og forbedre forudsigelseseffektiviteten.
Tilføj flere korrekt navngivne træningsdata
Jo mere korrekt mærkede træningsdata, du har, jo bedre vil din model klare opgaven. Lad os for eksempel antage, at du har et ja/nej-navn. Hvis de fleste af dataene kun har Ja i denne kolonne, vil din AI-model sandsynligvis ikke lære meget ud fra disse data. Hvis dine data ikke er korrekt mærkede, vil modellen sandsynligvis ikke lære særligt godt. Det er ideelt at begynde med et lille sæt korrekt mærkede eksempler – muligvis 100 eller mindre. Derfra kan du fortsætte med at fordoble antallet af eksempler flere gange og træne dem igen hver gang, samtidig med at du noterer dig ændringen i ydeevnen. Generelt set er flere data bedre, men der er faldende returneringer i relation til at tilføje data, jo større dine datasæt bliver.
Flere tip
- Sørg for, at du har en afbalanceret anvendelse af mærker i dine træningsdata. Eksempel: Du kan bruge fire mærker til 100 tekstelementer. De to første mærker (tag1 og tag2) bruges til 90 tekstelementer, men de øvrige to (tag3 og tag4) bruges kun for de resterende 10 tekstelementer. Den manglende balance kan medføre, at din model har svært ved at forudsige tag3 eller tag4.
- Sørg for, at du oplærer modellen ved hjælp af data, der svarer til dem, du forventer at bruge modellen til.
Næste trin
Publicer din model til kategoriklassificering