Dela via


Testa din modell

När din modell har tränats kan du använda översättningar för att utvärdera modellens kvalitet. För att fatta ett välgrundat beslut om du vill använda vår standardmodell eller din anpassade modell bör du utvärdera deltat mellan din anpassade modell BLEU-poäng och vår standardmodell Baseline BLEU. Om din modell tränas inom en smal domän och dina träningsdata överensstämmer med testdata kan du förvänta dig en hög BLEU-poäng.

BLEU-poäng

BLEU (Tvåspråkig utvärderingsunderstudy) är en algoritm för att utvärdera precisionen eller noggrannheten för text som är maskinöversatt från ett språk till ett annat. Custom Translator använder BLEU-måttet som ett sätt att förmedla översättningsnoggrannhet.

En BLEU-poäng är ett tal mellan noll och 100. En poäng på noll anger en översättning av låg kvalitet där ingenting i översättningen matchade referensen. Poängen 100 anger en perfekt översättning som är identisk med referensen. Det är inte nödvändigt att uppnå en poäng på 100 – en BLEU-poäng mellan 40 och 60 anger en högkvalitativ översättning.

Läs mer

Modellinformation

  1. Välj bladet Modellinformation.

  2. Välj modellnamnet. Granska träningsdatum/-tid, total träningstid, antal meningar som används för träning, justering, testning och ordlista. Kontrollera om systemet genererade test- och justeringsuppsättningarna. Använd för att göra översättningsbegäranden Category ID .

  3. Utvärdera modellens BLEU-poäng . Granska testuppsättningen : BLEU-poängen är den anpassade modellpoängen och baslinje-BLEU är den förtränad baslinjemodell som används för anpassning. En högre BLEU-poäng innebär att översättningskvaliteten är hög med hjälp av den anpassade modellen.

    Skärmbild som illustrerar modellinformationen.

Testa kvaliteten på din modells översättning

  1. Välj bladet Testmodell .

  2. Välj modellnamn.

  3. Mänsklig utvärderingsöversättning från din anpassade modell och baslinjemodellen (vår förtränad baslinje som används för anpassning) mot referens (målöversättning från testuppsättningen).

  4. Om träningsresultaten är tillfredsställande placerar du en distributionsbegäran för den tränade modellen.

Nästa steg