Träna en anpassad attitydanalysmodell
Om du vill träna en modell startar du ett träningsjobb. Endast slutförda jobb skapar en användbar modell. Träningsjobb upphör att gälla efter sju dagar. Efter den här perioden kan du inte hämta jobbinformationen. Om ditt träningsjobb har slutförts och en modell har skapats påverkas det inte av att jobbet upphör att gälla. Du kan bara ha ett träningsjobb i taget och du kan inte starta andra jobb i samma projekt.
Träningstiderna kan vara var som helst från några minuter när du hanterar få dokument, upp till flera timmar beroende på datamängdens storlek och schemats komplexitet.
Förutsättningar
Innan du tränar din modell behöver du:
- Ett projekt som har skapats med ett konfigurerat Azure Blob Storage-konto.
Datadelning
Innan du påbörjar träningsprocessen delas märkta dokument i projektet in i en träningsuppsättning och en testuppsättning. Var och en av dem har olika funktioner. Träningsuppsättningen används för att träna modellen. Det här är den uppsättning som modellen lär sig klassen/klasserna som tilldelats till varje dokument. Testuppsättningen är en blinduppsättning som inte introduceras i modellen under träningen utan endast under utvärderingen. När modellen har tränats används den för att göra förutsägelser från dokumenten i testuppsättningen. Baserat på dessa förutsägelser beräknas modellens utvärderingsmått. Vi rekommenderar att du ser till att alla dina klasser är tillräckligt representerade i både tränings- och testuppsättningen.
Anpassad attitydanalys stöder två metoder för datadelning:
- Dela automatiskt upp testuppsättningen från träningsdata: Systemet delar upp dina märkta data mellan tränings- och testuppsättningarna enligt de procentandelar du väljer. Systemet försöker ha en representation av alla klasser i träningsuppsättningen. Den rekommenderade procentuella uppdelningen är 80 % för träning och 20 % för testning.
Kommentar
Om du väljer alternativet Dela upp testuppsättningen automatiskt från träningsdata delas endast de data som tilldelats träningsuppsättningen upp enligt de procentsatser som anges.
- Använd en manuell uppdelning av tränings- och testdata: Med den här metoden kan användarna definiera vilka etiketterade dokument som ska tillhöra vilken uppsättning.
Träna en modell
Så här börjar du träna din modell inifrån Language Studio:
Välj Träningsjobb på menyn till vänster.
Välj Starta ett träningsjobb på den översta menyn.
Välj Träna en ny modell och skriv in modellnamnet i textrutan. Du kan också skriva över en befintlig modell genom att välja det här alternativet och välja den modell som du vill skriva över från den nedrullningsbara menyn. Att skriva över en tränad modell är oåterkalleligt, men det påverkar inte dina distribuerade modeller förrän du distribuerar den nya modellen.
Som standard delar systemet upp dina märkta data mellan tränings- och testuppsättningarna enligt angivna procentandelar. Om du har dokument i testuppsättningen kan du dela upp tränings- och testdata manuellt.
Välj knappen Träna.
Om du väljer ID för träningsjobb i listan visas en sidoruta där du kan kontrollera träningsförloppet, jobbstatusen och annan information för det här jobbet.
Kommentar
- Endast slutförda träningsjobb genererar modeller.
- Träningen kan ta lite tid mellan ett par minuter och flera timmar baserat på storleken på dina märkta data.
- Du kan bara köra ett träningsjobb i taget. Du kan inte starta ett annat träningsjobb i samma projekt förrän det pågående jobbet har slutförts.
Avbryt träningsjobbet
Om du vill avbryta ett träningsjobb från Language Studio går du till sidan Träningsjobb . Välj det träningsjobb som du vill avbryta och välj Avbryt på den översta menyn.
Nästa steg
När träningen har slutförts kan du visa modellens prestanda för att eventuellt förbättra din modell om det behövs. När du är nöjd med din modell kan du distribuera den och göra den tillgänglig för användning.