Analyseurs lexicaux personnalisés dans SharePoint
Césure de mots est une des fonctionnalités clés de traitement de langage naturel (npl) activer la recherche et d'améliorent les résultats de la recherche (ou son rappel). Analyseurs lexicaux fractionnement un flux de texte en mots individuels ou des jetons sur lesquels vous pouvez baser le traitement des langues supplémentaires. Analyseurs lexicaux sont propres aux langues. En plus des analyseurs lexicaux intégrés, la recherche dans SharePoint permet d’utiliser des analyseurs lexicaux personnalisés afin que les utilisateurs puissent régler le comportement de coupure de mots en fonction de leurs besoins. Voir Langues prises en charge pour les personnalisations d’analyseurs lexicaux dans SharePoint pour obtenir une liste des langues prises en charge pour la personnalisation de l’analyseur lexical.
Pour plus d'informations sur la façon d'écrire un séparateur de mots, reportez-vous aux articles suivants
Comment basculer vers un analyseur lexicaux personnalisé dans SharePoint
Attention
[!ATTENTION] Lorsque vous remplacez existant analyseurs lexicaux, vous modifiez le Registre à vos propres risques. De sérieux problèmes peuvent se produire si vous modifiez le Registre de façon incorrecte à l'aide de l'Éditeur du Registre ou en utilisant une autre méthode. Ces problèmes peuvent nécessiter la réinstallation du système d'exploitation. Microsoft ne peut pas garantir que ces problèmes puissent être résolus. Basculer vers un autre analyseur lexical également risque de sérieux problèmes lors de l'indexation et l'interrogation. Avant de modifier le Registre, sauvegardez le Registre et assurez-vous que vous savez comment le restaurer en cas de problème.
Procédez comme suit pour remplacer le séparateur de mots existant avec un séparateur de mots personnalisés ou de remplacer le séparateur de mots existant avec un séparateur de mots dans une autre langue.
Ouvrez l'Éditeur du Registre, comme suit :
Sélectionnez Start, puis Run.
Dans la boîte de dialogue Open, tapez Regedit, puis choisissez OK.
Dans l'Éditeur du Registre, sélectionnez la sous-clé de Registre suivante :
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\15.0\Search\Setup\ContentIndexCommon\LanguageResources\Default\langue de la liste ci-dessous
Dans le volet droit, ouvrez le menu contextuel pour la valeur de Registre WBDLLPathOverride, puis choisissez Modify.
Dans la boîte de dialogue Edit String, dans la zone Value data, tapez le chemin d'accès à votre DLL Analyseur lexical personnalisée, puis choisissez OK. La nouvelle DLL doit être située dans le même répertoire que la DLL existante est remplacée.
Dans le volet droit, ouvrez le menu contextuel pour la valeur de Registre WBreakerClass, puis choisissez Modify.
Dans la boîte de dialogue Modifier la chaîne , dans la zone Données de la valeur , tapez l’ID de classe de votre analyseur lexicaux personnalisé, puis choisissez OK
Redémarrez le contrôleur d’hôte recherche SharePoint et SharePoint.
Effectuez une nouvelle analyse complète.
Langues prises en charge pour les personnalisations d’analyseur lexicaux dans SharePoint
Les langues suivantes sont prises en charge pour la personnalisation de séparateur de word :
- Arabe
- Bengali
- Bulgare
- Catalan
- Chinois (République populaire de Chine)
- Chinois (Taiwan)
- Croate
- Tchèque
- Danois
- Néerlandais (néerlandais)
- Anglais (États-Unis)
- Estonien
- Finnois
- Français (standard)
- Allemand (standard)
- Grec
- Goudjrati
- Hébreu
- Hindi
- Hongrois
- Islandais
- Indonésien
- Italien (par défaut)
- Japonais
- Kannada
- Kazakh
- Coréen
- Letton
- Lituanien
- Malais
- Malayalam
- Marathe
- Norvégien
- Polonais
- Portugais (portugais)
- Pendjabi
- Roumain
- Russe
- Serbe (cyrillique)
- Slovaque
- Slovène
- Espagnol (Moderne)
- Suédois
- Tamoul
- Télougou
- Thaï
- Ukrainien
- Ourdou
- Vietnamien