Testování modelu
Po úspěšném vytrénování modelu můžete pomocí překladů vyhodnotit kvalitu modelu. Pokud chcete učinit informované rozhodnutí o tom, jestli použít náš standardní nebo vlastní model, měli byste vyhodnotit rozdíl mezi skóre BLEU vašeho vlastního modelu a naším standardním modelem BLEU. Pokud je váš model vytrénovaný v úzké doméně a trénovací data jsou konzistentní s testovacími daty, můžete očekávat vysoké skóre BLEU.
Skóre BLEU
BLEU (Bilingual Evaluation Understudy) je algoritmus pro vyhodnocení přesnosti nebo přesnosti textu, který je strojově přeložen z jednoho jazyka do druhého. Custom Translator používá metriku BLEU jako jeden ze způsobů vyjádření přesnosti překladu.
Skóre BLEU je číslo mezi nulou a 100. Skóre nuly označuje překlad s nízkou kvalitou, kde se v překladu nic neshoduje s odkazem. Skóre 100 označuje perfektní překlad, který je identický s odkazem. Není nutné dosáhnout skóre 100 – skóre BLEU mezi 40 a 60 označuje vysoce kvalitní překlad.
Podrobnosti o modelu
Vyberte okno Podrobnosti modelu.
Vyberte název modelu. Zkontrolujte datum a čas trénování, celkový čas trénování, počet vět použitých pro trénování, ladění, testování a slovník. Zkontrolujte, jestli systém vygeneroval testovací a ladicí sady.
Category ID
Použijte příkaz k provádění žádostí o překlad.Vyhodnotí skóre BLEU modelu. Zkontrolujte testovací sadu: Skóre BLEU je vlastní skóre modelu a směrný plán BLEU je předem natrénovaný základní model použitý k přizpůsobení. Vyšší skóre BLEU znamená, že vlastní model používá vysokou kvalitu překladu.
Testování kvality překladu modelu
Vyberte okno Testovací model .
Vyberte název modelu.
Lidské vyhodnocení překladu z vlastního modelu a standardního modelu (náš předem natrénovaný směrný plán používaný pro přizpůsobení) proti referenci (cílový překlad ze sady testů).
Pokud jsou výsledky trénování uspokojivé, umístěte žádost o nasazení pro natrénovaný model.