Rozszerzanie zasobów językowych
Usługa Windows Search używa zasobów językowych, takich jak moduły dzielenia wyrazów i stemmery, aby przerwać tekst w ustawieniach regionalnych natywnych podczas tworzenia indeksu i przetwarzania zapytań. Firma Microsoft udostępnia dzielniki wyrazów i stemmery dla kilku języków. W tej sekcji opisano, jak zaimplementować i używać niestandardowych elementów podziału wyrazów i stemmerów dla języków i regionów innych niż te oferowane przez Microsoft.
- Zrozumienie składników zasobów językowych
- Wdrażanie narzędzia Word Breaker i stemmera
- zagadnienia dotyczące lingwistyki i unicode
- Rozwiązywanie problemów z zasobami językowymi i najlepszymi rozwiązaniami
Dodatkowe zasoby
- Aby uzyskać listę języków obsługiwanych przez segmentatory wyrazów, zobacz Języki obsługiwane przez wyszukiwanie w systemie Windows.
- Jeśli musisz zidentyfikować język tekstu, możesz użyć funkcji automatycznego wykrywania języka (LAD), która jest dostępna w systemie Windows 7 lub nowszym. Aby uzyskać więcej informacji, zobacz Extended Linguistic Services (ELS).
- Aby uzyskać odpowiednią dokumentację referencyjną, zobacz interfejsy dodatku danych .
Tematy pokrewne