Фильтры IFilter и обработчики протокола (Office SharePoint Server 2007)
Обходчик в Microsoft Office SharePoint Server 2007 использует обработчики протокола, чтобы получить доступ к содержимому, затем фильтры IFilter для извлечения содержимого из файлов, на которых выполнен обход. Фильтры IFilter удаляют форматирование приложений перед индексированием содержимого документа обработчиком. Office SharePoint Server 2007 выполняет обход только для типов файлов, для которых установлен обработчик протокола и фильтр IFilter.
В этом разделе приведены фильтры IFilter и обработчики протокола, которые включены в установку Office SharePoint Server 2007 по умолчанию, а также описывается, как можно установить и зарегистрировать дополнительные фильтры IFilter и обработчики протокола.
Обходчик использует следующие обработчики протокола и фильтры IFilter:
Обходчик извлекает начальный адрес источников контента и вызывает обработчик протокола, основываясь на префиксе URL.
Обработчик протокол подключается к источнику контента и извлекает системные метаданные, а также информацию из списков управления доступом.
Обработчик протокола идентифицирует тип файла каждого элемента контента на основе расширения файла и вызывает соответствующий фильтр IFilter, связанный с этим типом файла.
Фильтр IFilter извлекает содержимое, удаляя встроенное форматирование, и затем извлекает метаданные элемента контента.
Выполняется анализ содержимого на основе одного или нескольких средств разбиения текста на слова, зависящих от языка, затем содержимое добавляется в индекс контента, также называемый полнотекстовым индексом. Метаданные и списки управления доступом добавляются в базу данных контента.
В этом разделе:
Установка пакета фильтров Microsoft (Office SharePoint Server 2007)
Установка обработчиков протоколов (Office SharePoint Server)
См. также
Понятия
Добавление источников контента (Office SharePoint Server 2007)