Compartilhar via


Suporte a idiomas para a Análise de Texto personalizada para saúde

Este artigo oferece informações sobre os idiomas atualmente compatíveis com a Análise de Texto personalizada para saúde.

Opção multilíngue

Com a Análise de Texto personalizada para saúde, você pode treinar um modelo em um idioma e usá-lo para extrair entidades de documentos em outros idiomas. Esse recurso evita o problema de criar projetos separados para cada idioma e, em vez disso, combinar seus conjuntos de dados em um único projeto, facilitando a escala de seus projetos para vários idiomas. Você pode treinar seu projeto inteiramente com documentos em inglês e consultá-lo em: francês, alemão, mandarim, japonês, coreano e outros idiomas. Você pode habilitar a opção multilíngue como parte do processo de criação do projeto ou posteriormente por meio das configurações do projeto.

Você não precisa adicionar a mesma quantidade de documentos para cada idioma. Você deve criar a maioria do seu projeto em um idioma e adicionar apenas alguns documentos em idiomas que observar não estão funcionando bem. Se você criar um projeto que esteja principalmente em inglês e começar a testá-lo em francês, alemão e espanhol, poderá observar que o alemão não é executado, bem como os outros dois idiomas. Nesse caso, considere adicionar 5% dos documentos originais em inglês em alemão, treinar um novo modelo e testar em alemão novamente. Na página rotulagem de dados no Language Studio, você pode selecionar o idioma do documento que você está adicionando. Você deverá ver resultados melhores para consultas em alemão. Quanto mais documentos rotulados você adicionar, maior será a probabilidade de aprimoramento dos resultados. Quando você adiciona dados em outro idioma, não deve esperar que eles afetem negativamente outros idiomas.

Não há suporte para hebraico em projetos multilíngues. Se o idioma principal do projeto for hebraico, você não poderá adicionar dados de treinamento em outros idiomas ou consultar o modelo usando outros idiomas. Da mesma forma, se o idioma principal do projeto não for hebraico, você não poderá adicionar dados de treinamento em hebraico ou consultar o modelo em hebraico.

Suporte ao idioma

A Análise de Texto personalizada para saúde dá suporte a .txt arquivos nos seguintes idiomas:

Linguagem Código de idioma
Inglês en
Francês fr
Alemão de
Espanhol es
Italiano it
Português (Portugal) pt-pt
Hebraico he

Próximas etapas