Considerações linguísticas e Unicode
Esta seção contém uma lista de considerações linguísticas e Unicode que podem afetar a implementação do separador de palavras e do lematizador. A lista não é completa.
Esta seção inclui os seguintes tópicos:
- de normalização do formulário surface
- considerações linguísticas diversas e Unicode
Recursos adicionais
- Para obter uma lista de lanuages compatíveis com separadores de palavras, consulte Idiomas compatíveis com ode Pesquisa do Windows.
- Se você precisar identificar o idioma de um texto, poderá usar a Detecção Automática de Idioma (LAD), que está disponível no Windows 7 e posterior. Para obter mais informações, consulte ELS (Serviços Linguísticos Estendidos).
- Para obter a documentação de referência aplicável, consulte interfaces de suplemento de dados.
Tópicos relacionados
-
estendendo de recursos de idioma
-
implementando um separador de palavras e de lematizador
-
solução de problemas de recursos de linguagem e práticas recomendadas