Testare il modello
Dopo aver completato il training del modello, è possibile usare le traduzioni per valutare la qualità del modello. Per decidere in modo informato se usare il modello standard o il modello personalizzato, è consigliabile valutare le differenze tra il punteggio BLEU del modello personalizzato e il punteggio BLEU di base del modello standard. Se il training del modello è stato eseguito in un dominio ristretto e i dati del training sono coerenti con i dati di test, il punteggio BLEU dovrebbe essere elevato.
Punteggio BLEU
BLEU (Bilingual Evaluation Understudy) è un algoritmo che permette di valutare la precisione o l'accuratezza del testo tradotto automaticamente da una lingua a un'altra. Traduttore personalizzato usa la metrica BLEU come indicatore dell'accuratezza della traduzione.
Un punteggio BLEU è un numero compreso tra zero e 100. Un punteggio pari a zero indica una traduzione di bassa qualità, in cui nulla nella traduzione corrisponde al riferimento. Un punteggio pari a 100 indica una traduzione perfetta identica al riferimento. Non è necessario ottenere un punteggio pari a 100. Un punteggio BLEU compreso tra 40 e 60 indica una traduzione di alta qualità.
Dettagli del modello
Selezionare il pannello Dettagli modello.
Selezionare il nome del modello. Esaminare la data/ora di training, il tempo totale di training, il numero di frasi usate per il training, l'ottimizzazione, il test e il dizionario. Controllare se il sistema ha generato i set di test e di ottimizzazione. Usare
Category ID
per effettuare richieste di traduzione.Valutare il punteggio BLEU del modello. Esaminare il set di test: il punteggio BLEU è il punteggio del modello personalizzato mentre il punteggio BLEU di base è il modello di base con training preliminare usato per la personalizzazione. Un punteggio BLEU più elevato significa una qualità di traduzione alta usando il modello personalizzato.
Testare la qualità della traduzione del modello
Selezionare il pannello Test modello.
Selezionare Nome modello.
Valutare la traduzione ottenuta dal modello personalizzato e dal modello di base (la baseline con training preliminare usata per la personalizzazione) confrontandola al riferimento (traduzione di destinazione ottenuta dal set di test).
Se i risultati del training sono soddisfacenti, inserire una richiesta di distribuzione per il modello sottoposto a training.
Passaggi successivi
- Informazioni su come pubblicare o distribuire un modello personalizzato.
- Informazioni su come tradurre i documenti con un modello personalizzato.