Поделиться через


Редактирование файла пропускаемых слов (Office SharePoint Server)

Пропускаемое слово — это слово, бесполезное при поиске, например "о" или "на". Файлы пропускаемых слов, иногда также называемые файлами "стоп-слов", содержат списки слов, которые должны исключаться или игнорироваться, когда пользователь выполняет запрос. Эти списки могут включать слова, ненужные для поиска, например союзы, артикли, прилагательные и наречия, а также общие имена, оскорбительные и неподходящие слова.

Содержание:

  • Общие сведения о файлах пропускаемых слов

  • Редактирование файла пропускаемых слов

  • Список файлов пропускаемых слов по языкам

Общие сведения о файлах пропускаемых слов

Список пропускаемых слов для языка хранится в файле пропускаемых слов для этого языка. Если для какого-либо языка не существует список пропускаемых слов, то Microsoft Office SharePoint Server 2007 использует независимый от языков файл пропускаемых слов noiseneu.txt. Средство разбиения на слова для конкретного языка идентифицирует отдельные слова путем определения границ слов на основе лексических правил этого языка. Когда средство разбиения на слова для конкретного языка осуществляет поиск слов во время индексирования или выполнения запроса, то оно удаляет слова, перечисленные в файле пропускаемых слов. Дополнительные сведения о языках, поддерживаемых файлами пропускаемых слов, см. в разделе "Список файлов пропускаемых слов по языкам".

По умолчанию файлы пропускаемых слов создаются и хранятся в следующем расположении на сервере запросов: Диск:\Program Files\Microsoft Office Servers\12.0\Data\Config. Файлы пропускаемых слов из этого расположения копируются для каждого экземпляра службы поиска Майкрософт, существующего на сервере запросов, в следующее расположение: Диск:\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<UID_приложения>\Config, где <UID_приложения> — это GUID, связанный с каждым экземпляром службы поиска.

Примечание

Если изменяются файлы пропускаемых слов в расположении по умолчанию, то измененная версия этих файлов автоматически копируется каждый раз, когда создается новый поставщик общих служб. Если файлы пропускаемых слов изменяются в расположении по умолчанию после создания поставщика общих служб, то необходимо скопировать эти файлы из расположения по умолчанию в заданный каталог для каждого существующего поставщика общих служб.

При добавлении пропускаемых слов точность поисков может уменьшиться. Однако размер индекса контента тоже уменьшится. Меньший размер индекса контента помогает повысить производительность. Если потребуется, чтобы поиск возвращал эти слова, их можно удалить из списка пропускаемых слов.

При удалении слов из файла пропускаемых слов изменения не будут действовать до тех пор, пока не будет сброшен индекс контента и выполнен полный обход всего контента, в которое входят удаленные из файла слова. При добавлении слов в файл пропускаемых слов нет необходимости выполнять полный обход всего контента, потому что эти слова не будут включаться в поиск. Однако размер индекса не уменьшится до тех пор, пока не будет выполнен полный обход контента.

Не следует удалять файлы пропускаемых слов. Если требуется, чтобы эти слова не удалялись при обновлении или поиске, можно удалить их из файла. Если же удалить файл пропускаемых слов, то все одиночные символы не будут считаться пропускаемыми словами.

Редактирование файла пропускаемых слов

Для редактирования файла пропускаемых слов используется следующая процедура.

Редактирование файла пропускаемых слов

  1. Запустите программу "Блокнот" и откройте в ней файл пропускаемых слов. Сведения о расположении и определении соответствующего файла пропускаемых слов см. в разделе "Общие сведения о файлах пропускаемых слов".

  2. Отредактируйте список, включив в него только те слова, которые должны игнорироваться в запросе на поиск.

  3. Сохраните файл пропускаемых слов и закройте программу "Блокнот".

    Примечание

    При сохранении измененного файла пропускаемых слов всегда используйте значение по умолчанию Encoding.

  4. Перезапустите службу поиска Office SharePoint Server, выполнив следующие шаги.

    1. Нажмите Пуск и последовательно выберите пункты Администрирование и Службы.

    2. Щелкните правой кнопкой мыши пункт Служба поиска Office SharePoint Server и нажмите кнопку Перезапуск.

  5. Чтобы служба поиска использовала изменения в файле пропускаемых слов, необходимо запустить полный обход источника контента. Сведения о том, как это сделать, см. в статье Запуск полного обхода содержимого (Office SharePoint Server 2007).

Список файлов пропускаемых слов по языкам

В Office SharePoint Server 2007 имеются файлы пропускаемых слов для следующих языков:

Язык Имя файла

Арабский

noiseara.txt

Бенгальский

noiseben.txt

Болгарский

noisebul.txt

Каталонский

noisecat.txt

Китайский (упрощенное письмо)

noisechs.txt

Китайский (традиционное письмо)

noisecht.txt

Хорватский

noisecro.txt

Датский

noisedan.txt

Голландский (Нидерланды)

noisenld.txt

Английский (Великобритания)

noiseeng.txt

Английский (США)

noiseenu.txt

Финский

noisefin.txt

Французский

noisefra.txt

Немецкий

noisedeu.txt

Греческий

noisegrc.txt

Гуджарати

noiseguj.txt

Иврит

noiseheb.txt

Хинди

noisehin.txt

Исландский

noiseice.txt

Индонезийский

noiseind.txt

Итальянский

noiseita.txt

Японский

noisejpn.txt

Каннада

noisekan.txt

Корейский

noisekor.txt

Латышский

noiselat.txt

Литовский

noiselit.txt

Малайский

noisemal.txt

Малаялам

noisemly.txt

Маратхи

noisemar.txt

Нейтральный

noiseneu.txt

Норвежский (букмол)

noisenor.txt

Польский

noiseplk.txt

Польский

noisepol.txt

Португальский

noisepor.txt

Португальский (Бразилия)

noiseptb.txt

Пенджабский

noisepun.txt

Румынский

noiserom.txt

Русский

noiserus.txt

Сербский (кириллица)

noisesbc.txt

Сербский (латиница)

noisesbl.txt

Словацкий

noisesvk.txt

Словенский

noiseslo.txt

Испанский

noiseesn.txt

Шведский

noisesve.txt

Тамильский

noisetam.txt

Телугу

noisetel.txt

Тайский

noisetha.txt

Турецкий

noisetur.txt

Украинский

noiseurk.txt

Урду (Пакистан)

noiseurd.txt