Partilhar via


Considerações linguísticas e Unicode

Esta seção contém uma lista de considerações linguísticas e Unicode que podem afetar a implementação do separador de palavras e do lematizador. A lista não é exaustiva.

Esta seção inclui os seguintes tópicos:

Recursos adicionais

  • Para obter uma lista de idiomas suportados por separadores de palavras, consulte Idiomas suportados pelo Windows Search.
  • Se precisar de identificar o idioma de um pedaço de texto, pode utilizar a Deteção Automática de Idioma (LAD), que está disponível no Windows 7 e posterior. Para obter mais informações, consulte Extended Linguistic Services (ELS).
  • Para obter a documentação de referência aplicável, consulte Data Add-in Interfaces.

Alargar os recursos linguísticos

Noções básicas sobre componentes de recursos de linguagem

Implementando um separador de palavras e um lematizador

Solução de problemas de recursos linguísticos e melhores práticas