Partilhar via


O que são documentos paralelos?

Documentos paralelos são pares de documentos em que um é a tradução do outro. Um documento do par contém as frases no idioma de origem e o outro documento contém as frases traduzidas para o idioma de destino. Não importa qual dos os idiomas esta marcado como “origem” ou como“destino”: um documento paralelo pode ser utilizado para preparar um sistema de tradução em qualquer direção.

Requisitos

Você precisa de um mínimo de 10.000 frases paralelas alinhadas exclusivas para treinar um sistema. Essa limitação é uma rede de segurança para garantir que suas frases paralelas contenham vocabulário único suficiente para treinar com sucesso um modelo de tradução. Como prática recomendada, adicione continuamente mais conteúdo paralelo e treine novamente para melhorar a qualidade do seu sistema de tradução. Para obter mais informações, consulte Alinhamento de frases.

A Microsoft exige que os documentos carregados para o Tradutor Personalizado não violem direitos autorais ou propriedades intelectuais de terceiros. Para mais informações, consulte os Termos de Utilização. O carregamento de um documento através do portal não altera a propriedade intelectual do próprio documento.

Utilização de documentos paralelos

O sistema utiliza documentos paralelos:

  1. Para aprender como palavras, frases e frases são comumente mapeadas entre os dois idiomas.

  2. Para aprender a processar o contexto apropriado dependendo das frases ao redor. Uma palavra nem sempre pode ser traduzida exatamente para a mesma palavra na outra língua.

Como prática recomendada, certifique-se de que existe uma correspondência de 1:1 frase entre as versões linguísticas de origem e de chegada dos documentos.

Se o seu projeto for específico do domínio (categoria), os seus documentos devem ser consistentes na terminologia dentro dessa categoria. A qualidade do sistema de tradução resultante depende do número de frases no conjunto de documentos e da qualidade das frases. Quanto mais exemplos seus documentos contiverem com diversos usos para uma palavra específica para sua categoria, melhor trabalho o sistema poderá fazer durante a tradução.

Os documentos carregados são privados em cada espaço de trabalho e podem ser usados em quantos projetos ou treinamentos você quiser. As frases extraídas de seus documentos são armazenadas separadamente em seu repositório como arquivos de texto Unicode simples e estão disponíveis para exclusão. Não use o Tradutor Personalizado como um repositório de documentos, você não pode baixar os documentos no mesmo formato que foi carregado.

Próximos passos