O que é um dicionário?
Um dicionário é um par alinhado de documentos que especifica uma lista de frases ou frases e suas traduções correspondentes. Use um dicionário em seu treinamento, quando quiser que o Translator traduza quaisquer ocorrências da frase de origem ou frase, usando a tradução que você fornece no dicionário. Os dicionários são por vezes chamados glossários ou bases de termos. Você pode pensar no dicionário como uma força bruta "copiar e substituir" para todos os termos que você lista. Além disso, o serviço Microsoft Custom Translator cria e faz uso de seus próprios dicionários de uso geral para melhorar a qualidade de sua tradução. No entanto, um dicionário fornecido pelo cliente tem precedente e é pesquisado primeiro para procurar palavras ou frases.
Os dicionários só funcionam para projetos em pares de idiomas que tenham um modelo de rede neural geral da Microsoft totalmente suportado por trás deles. Veja a lista completa de idiomas.
Dicionário de frases
Um dicionário de frases diferencia maiúsculas de minúsculas. É uma operação exata de encontrar e substituir. Quando você inclui um dicionário de frases no treinamento do seu modelo, qualquer palavra ou frase listada é traduzida da maneira especificada. O resto da frase é traduzido como de costume. Você pode usar um dicionário de frases para especificar frases que não devem ser traduzidas, fornecendo a mesma frase não traduzida nos arquivos de origem e de destino.
Dicionário dinâmico
O recurso de dicionário dinâmico permite personalizar traduções para termos ou frases específicos. Você define traduções personalizadas para seu contexto, idioma ou necessidades específicas exclusivos.
Dicionário de frases neurais
O dicionário de frases neurais estende nossos recursos de dicionário dinâmico e dicionário de frases padrão. Dicionários dinâmicos e de frases permitem que você personalize a saída da tradução, fornecendo suas próprias traduções para termos ou frases específicos. O recurso de dicionário dinâmico é usado com a API do Tradutor enquanto o dicionário de frases neurais é habilitado usando o Tradutor Personalizado. O dicionário de frases neurais melhora a qualidade da tradução de frases que incluem uma ou mais traduções de termos, permitindo que o modelo de tradução automática ajuste o termo e o contexto. Este ajustamento produz traduções mais fluentes. Ao mesmo tempo, preserva a precisão da tradução a longo prazo.
Dicionário de frases
Um dicionário de frases não diferencia maiúsculas de minúsculas. O dicionário de frases permite especificar uma tradução de destino exata para uma frase de origem. Para que ocorra uma correspondência de dicionário de frases, toda a frase enviada deve corresponder à entrada do dicionário de origem. Uma entrada do dicionário de origem que termina com pontuação é ignorada durante a partida. Se apenas uma parte da frase corresponder, a entrada não será correspondida. Quando uma correspondência é detetada, a entrada de destino do dicionário de frases é retornada.
Treinamentos somente para dicionários
Você pode treinar um modelo usando apenas dados de dicionário. Para fazer isso, selecione apenas o documento do dicionário (ou vários documentos de dicionário) que você deseja incluir e selecione Criar modelo. Como este treinamento é apenas dicionário, não há um número mínimo de frases de treinamento exigidas. Seu modelo normalmente conclui o treinamento mais rápido do que um treinamento padrão. Os modelos resultantes usam os modelos de linha de base da Microsoft para tradução com a adição dos dicionários adicionados. Você não recebe um relatório de teste.
Nota
O Tradutor Personalizado não alinha arquivos de dicionário, por isso é importante que haja um número igual de frases/frases de origem e de destino em seus documentos de dicionário e que elas estejam alinhadas com precisão.
Recomendações
Os dicionários não substituem o treinamento de um modelo usando dados de treinamento. Para obter os melhores resultados, recomendamos que o sistema aprenda com os dados de preparação. No entanto, quando frases ou substantivos compostos devem ser traduzidos literalmente, use um dicionário de frases.
O dicionário de frases deve ser usado com moderação. Quando uma frase dentro de uma frase é substituída, o contexto dessa frase é perdido ou limitado para traduzir o resto da frase. O resultado é que, enquanto a frase ou palavra dentro da frase é traduzida de acordo com o dicionário fornecido, a qualidade geral da tradução da frase muitas vezes sofre.
O dicionário de frases funciona bem para substantivos compostos como nomes de produtos ("Microsoft SQL Server"), nomes próprios ("Cidade de Hamburgo") ou recursos de produtos ("tabela dinâmica"). Não funciona tão bem para verbos ou adjetivos porque, normalmente, essas palavras são altamente contextuais dentro da língua de origem ou de chegada. A melhor prática é evitar entradas de dicionário de frases para qualquer coisa, exceto substantivos compostos.
Se você estiver usando um dicionário de frases, maiúsculas e pontuação são importantes. As entradas do dicionário são sensíveis a maiúsculas e minúsculas e pontuações. O Tradutor Personalizado só corresponde a palavras e frases na frase de entrada que usam exatamente os mesmos sinais de maiúsculas e pontuação especificados no arquivo do dicionário de origem. Além disso, as traduções refletem a maiúscula e a pontuação fornecidas no arquivo do dicionário de destino.
Exemplo
- Se você estiver treinando um sistema de inglês para espanhol que usa um dicionário de frases e especificar o SQL Server no arquivo de origem e o Microsoft SQL Server no arquivo de destino. Quando você solicita a tradução de uma frase que contém a frase SQL server, o Tradutor Personalizado corresponde à entrada do dicionário e à tradução que contém o Microsoft SQL Server.
- Quando você solicita a tradução de uma frase que inclui a mesma frase, mas não corresponde ao que está no arquivo de origem, como sql server, sql Server ou SQL Server, ela não retornará uma correspondência do dicionário.
- A tradução segue as regras da língua de chegada, conforme especificado no seu dicionário de frases.
Para obter mais informações sobre dicionário de frases neurais, consulte Orientações e recomendações de dicionário neural.
Se você estiver usando um dicionário de frases, a pontuação no final da frase será ignorada.
Exemplo
- Se o seu dicionário de origem contiver "Esta frase termina com pontuação!", então todos os pedidos de tradução que contenham "Esta frase termina com pontuação" correspondem.
Seu dicionário deve conter linhas de origem exclusivas. Se uma linha de origem (uma palavra, frase ou frase) aparecer mais de uma vez em um arquivo de dicionário, o sistema sempre usará a última entrada fornecida e retornará o destino quando uma correspondência for encontrada.
Evite adicionar frases que consistam apenas em números ou sejam palavras de duas ou três letras, como siglas, no arquivo do dicionário de origem.