Compartilhar via


O que é um dicionário?

Um dicionário é um par de documentos alinhados que especifica uma lista de frases ou sentenças e suas respectivas traduções. Use um dicionário no seu treinamento quando quiser que o Tradutor traduza todas as instâncias da frase ou sentença de origem, usando a tradução que você forneceu no dicionário. Dicionários são às vezes chamados de glossários ou bases de termos. Você pode pensar no dicionário como um recurso “copiar e substituir” de força bruta para todos os termos listados. Além disso, o Tradutor Personalizado da Microsoft compila e usa seus próprios dicionários de uso geral para melhorar a qualidade de sua tradução. No entanto, um dicionário fornecido pelo cliente terá precedência e será pesquisado primeiro ao buscar palavras ou frases.

Os dicionários funcionam apenas para projetos em pares de idiomas que possuem um modelo de rede neural geral da Microsoft totalmente suportado por trás deles. Consulte a lista completa de idiomas.

Dicionário de frase

Um dicionário de frases diferencia maiúsculas de minúsculas. Trata-se de uma operação exata de localização e substituição. Quando você inclui um dicionário de frases no treinamento do seu modelo, qualquer palavra ou frase listada é traduzida da maneira que você especificou. O resto da frase é traduzido como de costume. Você pode usar um dicionário de frases para especificar frases que não devem ser traduzidas, fornecendo a mesma frase não traduzida nos arquivos de origem e de destino.

Dicionário dinâmico

O recurso de dicionário dinâmico permite personalizar traduções para termos ou frases específicos. Você define traduções personalizadas para seu contexto exclusivo, idioma ou necessidades específicas.

Dicionário de frases neurais

O dicionário de frases neurais estende nossos recursos de dicionário dinâmico e dicionário de frases padrão. Os dicionários dinâmicos e de frases permitem personalizar a saída da tradução fornecendo suas próprias traduções para termos ou frases específicos. O recurso de dicionário dinâmico é usado com a API de Tradutor enquanto o dicionário de frases neurais está habilitado usando o Tradutor Personalizado. O dicionário de frases neurais melhora a qualidade da tradução para frases que incluem uma ou mais traduções de termos, permitindo que o modelo de tradução automática ajuste tanto o termo quanto o contexto. Esse ajuste produz traduções mais fluentes. Ao mesmo tempo, preserva a precisão das traduções de alto termo.

Dicionário de frases

Um dicionário de frases não diferencia maiúsculas de minúsculas. O dicionário de sentenças permite que você especifique uma tradução de destino exata para uma frase de origem. Para que uma correspondência de dicionário de sentença ocorra, toda a sentença enviada deve corresponder à entrada do dicionário de origem. Uma entrada do dicionário de origem que termina com uma pontuação será ignorada durante a correspondência. Se apenas uma parte da sentença corresponder, a entrada não será igual. Quando uma correspondência é detectada, a entrada de destino do dicionário de frases é retornada.

Treinamentos somente de dicionário

Você pode treinar um modelo usando apenas dados do dicionário. Para fazer isso, selecione apenas o documento do dicionário (ou vários documentos do dicionário) que você deseja incluir e selecione Criar modelo. Como esse é um treinamento somente para o dicionário, não há um número mínimo necessário de sentenças de treinamento. Seu modelo normalmente completará o treinamento muito mais rápido que um treinamento padrão. Os modelos resultantes usam os modelos de linha de base da Microsoft para tradução incluindo os dicionários que você adiciona. Você não receberá um relatório de teste.

Observação

O Tradutor Personalizado não alinha as sentenças dos arquivos do dicionário, portanto é importante que haja um número igual de frases/sentenças de origem e de destino nos documentos do dicionário e que elas estejam alinhadas corretamente.

Recomendações

  • Dicionários não são um substituto para treinar um modelo usando dados de treinamento. Para resultados melhores, recomendamos permitir que o sistema aprenda com os seus dados de treinamento. No entanto, quando frases ou substantivos compostos tiverem que ser traduzidos textualmente, use um dicionário de frases.

  • O dicionário de frase deve ser usado com moderação. Quando uma frase dentro de uma sentença é substituída, o contexto dentro dessa frase é perdido ou limitado para traduzir o resto da sentença. O resultado é que, enquanto a frase ou palavra dentro da sentença é traduzida de acordo com o dicionário fornecido, a qualidade geral da tradução da frase frequentemente sofrerá.

  • O dicionário de frases funciona bem para nomes compostos como nomes de produtos (“Microsoft SQL Server”), nomes próprios (“Cidade de Hamburgo”) ou recursos de produto (“tabela dinâmica”). Não funciona tão bem para verbos ou adjetivos porque, normalmente, essas palavras são altamente contextuais no idioma de origem ou de destino. A melhor prática é evitar entradas de dicionário de frase, exceto para substantivos compostos.

  • Se você estiver usando um dicionário de frases, o uso de iniciais maiúsculas e a pontuação são importantes. As entradas do dicionário diferenciam maiúsculas e minúsculas e pontuação. O Tradutor Personalizado corresponde apenas palavras e frases na sentença de entrada que usarem exatamente as mesmas maiúsculas e minúsculas e pontuação, conforme especificado no arquivo de dicionário de origem. Além disso, as traduções refletem as maiúsculas e minúsculas e a pontuação fornecidas no arquivo de dicionário de destino.

    Exemplo

    • Se você estiver treinando um sistema de inglês para espanhol que usa um dicionário de frases e especificar SQL Server no arquivo de origem e Microsoft SQL Server no arquivo de destino. Quando você solicitar a tradução de uma sentença que contiver a frase SQL Server, o Tradutor Personalizado corresponde à entrada do dicionário e a tradução conterá Microsoft SQL Server.
    • Quando você solicita a tradução de uma frase que inclui a mesma frase, mas não corresponde ao que está em seu arquivo de origem, como sql server, sql Server ou SQL Server, ela não retorne uma correspondência *do seu dicionário.
    • A tradução segue as regras do idioma de destino, conforme especificado no dicionário de frases.
  • Para obter mais informações sobre o dicionário de frases neurais, confira Diretrizes e recomendações do dicionário neural.

  • Se você estiver usando um dicionário de sentenças, a pontuação de final de frase será ignorada.

    Exemplo

    • Se o seu dicionário de origem contiver "Essa frase termina com pontuação!", então quaisquer solicitações de tradução que contenham "Essa frase termina com pontuação" serão correspondentes.
  • Seu dicionário deve conter linhas de origem exclusivas. Se uma linha de origem (uma palavra, frase ou sentença) aparece mais de uma vez em um arquivo de dicionário, o sistema sempre usa a última entrada fornecida e retornará o destino quando uma correspondência for encontrada.

  • Evite adicionar frases que consistem apenas em números ou palavras de duas ou três letras, como siglas, no arquivo de dicionário de origem.

Próximas etapas