Testar o seu modelo
Uma vez que seu modelo é treinado com sucesso, você pode usar traduções para avaliar a qualidade do seu modelo. Para tomar uma decisão informada sobre usar nosso modelo padrão ou seu modelo personalizado, você deve avaliar o delta entre sua pontuação BLEU do modelo personalizado e nosso modelo padrão Baseline BLEU. Se o seu modelo for treinado em um domínio restrito e seus dados de treinamento forem consistentes com os dados de teste, você pode esperar uma pontuação BLEU alta.
Pontuação BLEU
BLEU (Bilingual Evaluation Understudy) é um algoritmo para avaliar a precisão ou exatidão de texto que é traduzido automaticamente de uma língua para outra. O Custom Translator usa a métrica BLEU como uma forma de transmitir a precisão da tradução.
Uma pontuação BLEU é um número entre zero e 100. Uma pontuação zero indica uma tradução de baixa qualidade em que nada na tradução correspondia à referência. Uma pontuação de 100 indica uma tradução perfeita que é idêntica à referência. Não é necessário atingir uma pontuação de 100 — uma pontuação BLEU entre 40 e 60 indica uma tradução de alta qualidade.
Detalhes do modelo
Selecione a folha Detalhes do modelo.
Selecione o nome do modelo. Revise a data/hora do treinamento, o tempo total do treinamento, o número de frases usadas para treinamento, ajuste, teste e dicionário. Verifique se o sistema gerou os conjuntos de teste e ajuste. Use o
Category ID
para fazer pedidos de tradução.Avalie a pontuação do modelo BLEU . Analise o conjunto de testes: a pontuação BLEU é a pontuação do modelo personalizado e a BLEU da linha de base é o modelo de linha de base pré-treinado usado para personalização. Uma pontuação BLEU mais alta significa que há alta qualidade de tradução usando o modelo personalizado.
Teste a qualidade da tradução do seu modelo
Selecione Folha do modelo de teste .
Selecione o nome do modelo.
Tradução de avaliação humana do seu modelo personalizado e do modelo de linha de base (nossa linha de base pré-treinada usada para personalização) em relação à referência (tradução de destino do conjunto de testes).
Se os resultados do treinamento forem satisfatórios, faça uma solicitação de implantação para o modelo treinado.
Próximos passos
- Saiba como publicar/implantar um modelo personalizado.
- Saiba como traduzir documentos com um modelo personalizado.