Фильтры IFilter и обработчики протокола (Search Server 2008)
Обновлено: 2009-04-16
Примечание: |
---|
Если не указано иное, содержащаяся в данной статье информация относится как к серверу Microsoft Search Server 2008, так и к серверу Microsoft Search Server 2008 Express. |
Программа-обходчик в Search Server 2008 использует обработчики протокола для доступа к контенту и фильтры IFilter для извлечения контента из обходимых файлов. Фильтры IFilter удаляют форматирование, относящееся к приложению, а затем механизм индексирования индексирует контент документа. В Поисковый сервер обход выполняется только для типов файлов, для которых установлены обработчики протокола и фильтры IFilter.
В этом разделе описываются фильтры IFilter и обработчики протокола, которые по умолчанию устанавливаются вместе с Поисковый сервер, и описывается процесс установки и регистрации дополнительных фильтров IFilter и обработчиков протокола.
Программа-обходчик использует обработчики протокола и фильтры IFilter следующим образом.
Программа-обходчик получает начальные адреса источников контента и вызывает обработчик протокола в зависимости от префикса URL-адреса.
Обработчик протокола подключается к источнику контента и извлекает метаданные системного уровня и данные списков управления доступом.
Обработчик протокола определяет тип файла каждого элемента контента в зависимости от расширения имени файла и вызывает фильтр IFilter, связанный с этим типом файла.
Фильтр IFilter извлекает контент, удаляя форматирование, а затем получает метаданные элемента контента.
Контент проходит синтаксический анализ в одном или нескольких средствах разбиения текста на слова, в зависимости от языка, и добавляется в полнотекстовый индекс, который также называется индексом контента. Метаданные и списки управления доступом добавляются в базу данных поиска.
Содержание: