Редактирование файла пропускаемых слов (Office SharePoint Server)
Пропускаемое слово — это слово, бесполезное при поиске, например "о" или "на". Файлы пропускаемых слов, иногда также называемые файлами "стоп-слов", содержат списки слов, которые должны исключаться или игнорироваться, когда пользователь выполняет запрос. Эти списки могут включать слова, ненужные для поиска, например союзы, артикли, прилагательные и наречия, а также общие имена, оскорбительные и неподходящие слова.
Содержание:
Общие сведения о файлах пропускаемых слов
Редактирование файла пропускаемых слов
Список файлов пропускаемых слов по языкам
Общие сведения о файлах пропускаемых слов
Список пропускаемых слов для языка хранится в файле пропускаемых слов для этого языка. Если для какого-либо языка не существует список пропускаемых слов, то Microsoft Office SharePoint Server 2007 использует независимый от языков файл пропускаемых слов noiseneu.txt. Средство разбиения на слова для конкретного языка идентифицирует отдельные слова путем определения границ слов на основе лексических правил этого языка. Когда средство разбиения на слова для конкретного языка осуществляет поиск слов во время индексирования или выполнения запроса, то оно удаляет слова, перечисленные в файле пропускаемых слов. Дополнительные сведения о языках, поддерживаемых файлами пропускаемых слов, см. в разделе "Список файлов пропускаемых слов по языкам".
По умолчанию файлы пропускаемых слов создаются и хранятся в следующем расположении на сервере запросов: Диск:\Program Files\Microsoft Office Servers\12.0\Data\Config. Файлы пропускаемых слов из этого расположения копируются для каждого экземпляра службы поиска Майкрософт, существующего на сервере запросов, в следующее расположение: Диск:\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<UID_приложения>\Config, где <UID_приложения> — это GUID, связанный с каждым экземпляром службы поиска.
Примечание
Если изменяются файлы пропускаемых слов в расположении по умолчанию, то измененная версия этих файлов автоматически копируется каждый раз, когда создается новый поставщик общих служб. Если файлы пропускаемых слов изменяются в расположении по умолчанию после создания поставщика общих служб, то необходимо скопировать эти файлы из расположения по умолчанию в заданный каталог для каждого существующего поставщика общих служб.
При добавлении пропускаемых слов точность поисков может уменьшиться. Однако размер индекса контента тоже уменьшится. Меньший размер индекса контента помогает повысить производительность. Если потребуется, чтобы поиск возвращал эти слова, их можно удалить из списка пропускаемых слов.
При удалении слов из файла пропускаемых слов изменения не будут действовать до тех пор, пока не будет сброшен индекс контента и выполнен полный обход всего контента, в которое входят удаленные из файла слова. При добавлении слов в файл пропускаемых слов нет необходимости выполнять полный обход всего контента, потому что эти слова не будут включаться в поиск. Однако размер индекса не уменьшится до тех пор, пока не будет выполнен полный обход контента.
Не следует удалять файлы пропускаемых слов. Если требуется, чтобы эти слова не удалялись при обновлении или поиске, можно удалить их из файла. Если же удалить файл пропускаемых слов, то все одиночные символы не будут считаться пропускаемыми словами.
Редактирование файла пропускаемых слов
Для редактирования файла пропускаемых слов используется следующая процедура.
Редактирование файла пропускаемых слов
Запустите программу "Блокнот" и откройте в ней файл пропускаемых слов. Сведения о расположении и определении соответствующего файла пропускаемых слов см. в разделе "Общие сведения о файлах пропускаемых слов".
Отредактируйте список, включив в него только те слова, которые должны игнорироваться в запросе на поиск.
Сохраните файл пропускаемых слов и закройте программу "Блокнот".
Примечание
При сохранении измененного файла пропускаемых слов всегда используйте значение по умолчанию Encoding.
Перезапустите службу поиска Office SharePoint Server, выполнив следующие шаги.
Нажмите Пуск и последовательно выберите пункты Администрирование и Службы.
Щелкните правой кнопкой мыши пункт Служба поиска Office SharePoint Server и нажмите кнопку Перезапуск.
Чтобы служба поиска использовала изменения в файле пропускаемых слов, необходимо запустить полный обход источника контента. Сведения о том, как это сделать, см. в статье Запуск полного обхода содержимого (Office SharePoint Server 2007).
Список файлов пропускаемых слов по языкам
В Office SharePoint Server 2007 имеются файлы пропускаемых слов для следующих языков:
Язык | Имя файла |
---|---|
Арабский |
noiseara.txt |
Бенгальский |
noiseben.txt |
Болгарский |
noisebul.txt |
Каталонский |
noisecat.txt |
Китайский (упрощенное письмо) |
noisechs.txt |
Китайский (традиционное письмо) |
noisecht.txt |
Хорватский |
noisecro.txt |
Датский |
noisedan.txt |
Голландский (Нидерланды) |
noisenld.txt |
Английский (Великобритания) |
noiseeng.txt |
Английский (США) |
noiseenu.txt |
Финский |
noisefin.txt |
Французский |
noisefra.txt |
Немецкий |
noisedeu.txt |
Греческий |
noisegrc.txt |
Гуджарати |
noiseguj.txt |
Иврит |
noiseheb.txt |
Хинди |
noisehin.txt |
Исландский |
noiseice.txt |
Индонезийский |
noiseind.txt |
Итальянский |
noiseita.txt |
Японский |
noisejpn.txt |
Каннада |
noisekan.txt |
Корейский |
noisekor.txt |
Латышский |
noiselat.txt |
Литовский |
noiselit.txt |
Малайский |
noisemal.txt |
Малаялам |
noisemly.txt |
Маратхи |
noisemar.txt |
Нейтральный |
noiseneu.txt |
Норвежский (букмол) |
noisenor.txt |
Польский |
noiseplk.txt |
Польский |
noisepol.txt |
Португальский |
noisepor.txt |
Португальский (Бразилия) |
noiseptb.txt |
Пенджабский |
noisepun.txt |
Румынский |
noiserom.txt |
Русский |
noiserus.txt |
Сербский (кириллица) |
noisesbc.txt |
Сербский (латиница) |
noisesbl.txt |
Словацкий |
noisesvk.txt |
Словенский |
noiseslo.txt |
Испанский |
noiseesn.txt |
Шведский |
noisesve.txt |
Тамильский |
noisetam.txt |
Телугу |
noisetel.txt |
Тайский |
noisetha.txt |
Турецкий |
noisetur.txt |
Украинский |
noiseurk.txt |
Урду (Пакистан) |
noiseurd.txt |