Suporte a idiomas para a Análise de Texto personalizada para saúde
Este artigo oferece informações sobre os idiomas atualmente compatíveis com a Análise de Texto personalizada para saúde.
Opção multilíngue
Com a Análise de Texto personalizada para saúde, você pode treinar um modelo em um idioma e usá-lo para extrair entidades de documentos em outros idiomas. Esse recurso evita o problema de criar projetos separados para cada idioma e, em vez disso, combinar seus conjuntos de dados em um único projeto, facilitando a escala de seus projetos para vários idiomas. Você pode treinar seu projeto inteiramente com documentos em inglês e consultá-lo em: francês, alemão, mandarim, japonês, coreano e outros idiomas. Você pode habilitar a opção multilíngue como parte do processo de criação do projeto ou posteriormente por meio das configurações do projeto.
Você não precisa adicionar a mesma quantidade de documentos para cada idioma. Você deve criar a maioria do seu projeto em um idioma e adicionar apenas alguns documentos em idiomas que observar não estão funcionando bem. Se você criar um projeto que esteja principalmente em inglês e começar a testá-lo em francês, alemão e espanhol, poderá observar que o alemão não é executado, bem como os outros dois idiomas. Nesse caso, considere adicionar 5% dos documentos originais em inglês em alemão, treinar um novo modelo e testar em alemão novamente. Na página rotulagem de dados no Language Studio, você pode selecionar o idioma do documento que você está adicionando. Você deverá ver resultados melhores para consultas em alemão. Quanto mais documentos rotulados você adicionar, maior será a probabilidade de aprimoramento dos resultados. Quando você adiciona dados em outro idioma, não deve esperar que eles afetem negativamente outros idiomas.
Não há suporte para hebraico em projetos multilíngues. Se o idioma principal do projeto for hebraico, você não poderá adicionar dados de treinamento em outros idiomas ou consultar o modelo usando outros idiomas. Da mesma forma, se o idioma principal do projeto não for hebraico, você não poderá adicionar dados de treinamento em hebraico ou consultar o modelo em hebraico.
Suporte ao idioma
A Análise de Texto personalizada para saúde dá suporte a .txt
arquivos nos seguintes idiomas:
Linguagem | Código de idioma |
---|---|
Inglês | en |
Francês | fr |
Alemão | de |
Espanhol | es |
Italiano | it |
Português (Portugal) | pt-pt |
Hebraico | he |