Freigeben über


Benutzerdefinierte Wörtertrennungen in SharePoint

Wortumbruch ist eines der wichtigsten natürlicher Sprache Verarbeitung (NLP) Features, mit denen suchen, und Verbessern der Suchergebnisse (oder Rückruf). Worttrennmodule teilen ein Stream-Objekts von Text in einzelne Wörter oder Token, auf denen Sie zusätzliche Language Verarbeitung basieren können. Worttrennmodule sind sprachspezifische. Zusätzlich zur integrierten Worttrennmodule ermöglicht Suche in SharePoint die Verwendung von benutzerdefinierten Worttrennmodule, damit Benutzer Wortumbruch Verhalten entsprechend ihren Anforderungen optimieren können. Unter Unterstützte Sprachen für Anpassungen von Wörtertrennungen in SharePoint finden Sie eine Liste der Sprachen, die für die Anpassung von Wörtertrennungen unterstützt werden.

Informationen zum Schreiben von einem Worttrennmodul finden Sie in den folgenden Artikeln

Wechseln zu einer benutzerdefinierten Wörtertrennung in SharePoint

Achtung

Wenn Sie vorhandene Wörtertrennungen ersetzen, ändern Sie die Registrierung auf eigenes Risiko. Schwerwiegende Probleme können auftreten, wenn die Registrierung mit dem Registrierungs-Editor oder einer anderen Methode unsachgemäß bearbeitet wird. Diese Probleme erfordern möglicherweise eine Neuinstallation des Betriebssystems. Microsoft kann nicht stellen Sie sicher, dass diese Probleme gelöst werden können. Wechseln zu einem anderen Worttrennmodul möglicherweise auch schwerwiegenden Problemen führen beim Indizieren und Abfragen. Bevor Sie die Registrierung ändern, Sichern Sie die Registrierung, und stellen Sie sicher, dass Sie wissen, wie Sie die Registrierung wiederherstellen, wenn ein Problem auftritt.

Führen Sie die folgenden Schritte aus, ersetzen Sie das vorhandene Worttrennmodul mit einem benutzerdefinierten Worttrennmodul oder ersetzen das vorhandene Worttrennmodul mit einem Worttrennmodul in einer anderen Sprache.

  1. Öffnen Sie den Registrierungs-Editor wie folgt:

  2. Wählen Sie Start, und wählen Sie dann Run.

  3. Klicken Sie im Dialogfeld Open Geben Sie Regedit, und wählen Sie dann OK.

  4. Wählen Sie im Registrierungs-Editor den folgenden Registrierungsunterschlüssel:

    HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\15.0\Search\Setup\ContentIndexCommon\LanguageResources\Default\Sprache aus der folgenden Liste

  5. Klicken Sie im rechten Bereich öffnen Sie das Kontextmenü für den Registrierungswert WBDLLPathOverride, und wählen Sie Modify.

  6. Klicken Sie im Dialogfeld Edit StringValue data Sie im Feld Geben Sie den Pfad zu Ihrer benutzerdefinierten Worttrennmodul DLL-Datei, und wählen Sie dann OK. Die neue DLL sollte sich in demselben Pfad wie die vorhandene DLL befinden, die ersetzt wird.

  7. Klicken Sie im rechten Bereich öffnen Sie das Kontextmenü für den Registrierungswert WBreakerClass, und wählen Sie Modify.

  8. Geben Sie im Dialogfeld Zeichenfolge bearbeiten im Feld Wertdaten die Klassen-ID Ihrer benutzerdefinierten Wörtertrennung ein, und wählen Sie dann OK aus.

    Starten Sie den SharePoint-Suchhostcontroller und SharePoint neu.

  9. Führen Sie eine vollständige erneute Durchforstung durch.

Unterstützte Sprachen für die Anpassung der Wörtertrennung in SharePoint

Die folgenden Sprachen werden für die Anpassung von Word wörtertrennung unterstützt:

  • Arabisch
  • Bengali
  • Bulgarisch
  • Katalanisch
  • Chinesisch (Volksrepublik China)
  • Chinesisch (Taiwan)
  • Kroatisch
  • Tschechisch
  • Dänisch
  • Niederländisch (Niederländisch)
  • Englisch (Vereinigte Staaten)
  • Estnisch
  • Finnisch
  • Französisch (Standard)
  • Deutsch (Standard)
  • Griechisch
  • Gujarati
  • Hebräisch
  • Hindi
  • Ungarisch
  • Isländisch
  • Indonesisch
  • Italienisch (Standard)
  • Japanisch
  • Kannada
  • Kasachisch
  • Koreanisch
  • Lettisch
  • Litauisch
  • Malaiisch
  • Malayalam
  • Marathi
  • Norwegisch
  • Polnisch
  • Portugiesisch (Portugiesisch)
  • Punjabi
  • Rumänisch
  • Russisch
  • Serbisch (Kyrillisch)
  • Slowakisch
  • Slowenisch
  • Spanisch (Moderne Sortierung)
  • Schwedisch
  • Tamil
  • Telugu
  • Thailändisch
  • Ukrainisch
  • Urdu
  • Vietnamesisch

Siehe auch