Condividi tramite


Testare Il traduttore personalizzato per intelligenza artificiale di Azure

Dopo aver eseguito il training del modello di Traduttore personalizzato di Intelligenza artificiale di Azure, è possibile usare le traduzioni per valutare la qualità del modello. Per prendere una decisione informata sull'uso del modello Standard di Azure AI Translator o del modello personalizzato, è consigliabile valutare il delta tra il punteggio BLEU del modello personalizzato e la baseline DEL modello STANDARD di Azure AI Translator. Se il training del modello è stato eseguito in un dominio ristretto e i dati del training sono coerenti con i dati di test, il punteggio BLEU dovrebbe essere elevato.

Punteggio BLEU

BLEU (Bilingual Evaluation Understudy) è un algoritmo che permette di valutare la precisione o l'accuratezza del testo tradotto automaticamente da una lingua a un'altra. Traduttore personalizzato usa la metrica BLEU come indicatore dell'accuratezza della traduzione.

Un punteggio BLEU è un numero compreso tra zero e 100. Un punteggio pari a zero indica una traduzione di bassa qualità, in cui nulla nella traduzione corrisponde al riferimento. Un punteggio pari a 100 indica una traduzione perfetta identica al riferimento. Non è necessario ottenere un punteggio pari a 100. Un punteggio BLEU compreso tra 40 e 60 indica una traduzione di alta qualità.

Altre informazioni

Dettagli del modello di Traduttore personalizzato di Intelligenza artificiale di Azure

  1. Selezionare il pannello Dettagli modello.

  2. Selezionare il nome del modello. Esaminare la data/ora di training, il tempo totale di training, il numero di frasi usate per il training, l'ottimizzazione, il test e il dizionario. Controllare se il sistema ha generato i set di test e di ottimizzazione. Usare Category ID per effettuare richieste di traduzione.

  3. Valutare il punteggio BLEU del modello. Esaminare il set di test: il punteggio BLEU è il punteggio del modello personalizzato mentre il punteggio BLEU di base è il modello di base con training preliminare usato per la personalizzazione. Un punteggio BLEU più elevato significa una qualità di traduzione alta usando il modello personalizzato.

    Screenshot che illustra i dettagli del modello.

Testare la qualità della traduzione del modello

  1. Selezionare il pannello Test modello.

  2. Selezionare Nome modello.

  3. Valutare la traduzione ottenuta dal modello personalizzato e dal modello di base (la baseline con training preliminare usata per la personalizzazione) confrontandola al riferimento (traduzione di destinazione ottenuta dal set di test).

  4. Se i risultati del training sono soddisfacenti, inserire una richiesta di distribuzione per il modello sottoposto a training.

Passaggi successivi