Поделиться через


О фильтрах IFilter (Office SharePoint Server 2007)

В каждом файле, для которого выполняется обход, из контента должно быть удалено форматирование, перед тем как он будет добавлен в индекс контента. Форматирование файла зависит от приложения, которым он создан. Например, формат документа, созданного в Microsoft Office Word 2007, отличается от формата слайдов, созданных в Microsoft Office PowerPoint 2007. Модель индексации Microsoft Office SharePoint Server 2007 использует фильтры IFilter для удаления встроенного форматирования из контента, извлекаемого из элементов при обходе.

В следующей таблице описано поведение системы индексации в зависимости от того, установлен ли на сервер индекса фильтр IFilter, и внесен ли тип файла на страницу Управление типами файлов в администрировании поиска.

Фильтр IFilter установлен? Тип файла есть в списке Управление типами файлов? Результат

Да

Да

Содержимое файла и его свойства индексированы.

Нет

Да

Содержимое файла не индексирован, а его свойства индексированы.

Нет

Нет

Ни содержимое файла, ни его свойства не индексированы.

Фильтры IFilter и типы файлов

Каждый фильтр IFilter должен быть связан с видом файлов, которые он может фильтровать. Тип файла определяется трех или четырехбуквенными расширениями имени файла. Можно увидеть список типов файлов, для которых установлены в Office SharePoint Server 2007 установлены фильтры, на странице Управление типами файлов. Эту страницу можно открыть через страницу администрирования поставщика общих служб. Если фильтра для типа файлов, для которых нужно выполнять обход, нет, индекс контента в Office SharePoint Server 2007 может включать только свойства файлов и не может включать их содержимое. Если нужно индексировать содержимое, для которого нет фильтра IFilter, установленного по умолчанию, следует установить и зарегистрировать фильтр IFilter для этого типа файлов.

В следующей таблице перечислены установки страницы Управление типами файлов по умолчанию. Туда включены типы файлов, которые поддерживаются фильтрами IFilter, но не включены по умолчанию. Также на странице Управление типами файлов перечислены некоторые типы файлов, для которых фильтры IFilter не поддержаны по умолчанию. Информацию о том, как обновить список на странице Управление типами файлов, можно получить в разделе Указание типов файлов для обхода (Office SharePoint Server 2007).

Расширение имени файла Поддержка фильтра IFilter по умолчанию Включение типа файла по умолчанию

ASCX-файл

Да

Да

ASM-файлы

Да

Нет

ASP-файлы

Да

Нет

ASPX-файлы

Да

Да

BAT-файлы

Да

Нет

С-файлы

Да

Нет

CMD-файлы

Да

Нет

CPP-файлы

Да

Нет

CSS-файлы

Да

Нет

CXX-файлы

Да

Нет

DEF-файлы

Да

Нет

DIC-файлы

Да

Нет

DOC-файлы

Да

Да

DOCM-файлы

Да

Да

DOCX-файлы

Да

Да

DOT-файлы

Да

Да

EML-файлы

Да

Да

EXCH-файлы

Нет

Да

H-файлы

Да

Нет

HHC-файлы

Да

Нет

HHT-файлы

Да

Нет

HHP-файлы

Да

Нет

HTA-файлы

Да

Нет

HTM-файлы

Да

Да

HTML-файлы

Да

Да

HTW-файлы

Да

Нет

HTX-файлы

Да

Нет

JHTML-файлы

Нет

Да

JSP-файлы

Нет

Да

LNK-файлы

Да

Нет

MHT-файлы

Да

Да

MHTML-файлы

Да

Да

MPX-файлы

Да

Нет

MSG-файлы

Да

Да

MSPX-файлы

Нет

Да

NSF-файлы

Нет

Да

ODC-файлы

Да

Да

ONE-файлы

Нет

Нет

PHP-файлы

Нет

Да

POT-файлы

Да

Нет

PPS-файлы

Да

Нет

PPT-файлы

Да

Да

PPTM-файлы

Да

Да

PPTX-файлы

Да

Да

PUB-файлы

Да

Да

STM-файлы

Да

Нет

TIF-файлы

Да

Да

TIFF-файлы

Нет

Да

TRF--файлы

Да

Нет

TXT-файлы

Да

Да

URL-файлы

Нет

Да

VDX-файлы

Нет

Да

VSD-файлы

Нет

Да

VSS-файлы

Нет

Да

VST-файлы

Нет

Да

VSX-файлы

Нет

Да

VTX-файлы

Нет

Да

XLB-файлы

Да

Нет

XLC-файлы

Да

Нет

XLS-файлы

Да

Да

XLSM-файлы

Да

Да

XLXS-файлы

Да

Да

XLT-файлы

Да

Нет

XML-файлы

Да

Да

Примечание

Фильтры IFilter, которые дают возможность Office SharePoint Server 2007 индексировать файлы формата Adope Portable Document Format (PDF), предоставляются компанией Adobe. Дополнительную информацию об установке и настройке этих фильтров IFilter можно получить в разделе При поиске в портале SharePoint Portal Server 2003 или SharePoint Server 2007 для документов Adobe PDF, приведенных в результатах поиска, не отображаются значки. (на английском языке) (https://go.microsoft.com/fwlink/?linkid=144596&clcid=0x419) (на английском языке).

Пакет фильтров Microsoft

Microsoft предоставляет пакет фильтров, содержащий набор фильтров IFilter, которые являются дополнением к фильтрам, устанавливаемым автоматически вместе с Office SharePoint Server 2007. Пакет фильтров Microsoft устанавливает и регистрирует фильтры IFilter для следующих форматов файлов: файлы DOCX, DOCM, PPTX, PPTM, XLSX, XLSM, XLSB, ZIP, ONE, VDX, VSD, VSS, VST, VDX, VSX и VTX.

Дополнительную информацию можно получить в разделе Установка пакета фильтров Microsoft (Office SharePoint Server 2007).

Настраиваемые фильтры

Если необходимо выполнять обход документов, имеющих тип, не поддерживаемый фильтрами IFilter, которые поставляются с Office SharePoint Server 2007 или включенными в пакет фильтров Microsoft, следует установить нужный фильтр IFilter на сервер индекса. Сверьтесь с компанией-производителем приложения, предоставляет ли она фильтр IFilter для продуктов поиска Microsoft. Если приложение было создано в вашей организации, разработчики программного обеспечения, создавшие или поддерживающие это приложение, могут разработать для него фильтр IFilter. Дополнительную информацию можно получить в разделе Пакет SDK для Microsoft Search Server 2008 (на английском языке) (https://go.microsoft.com/fwlink/?linkid=141179&clcid=0x419) (на английском языке).

После установки фильтра IFilter, нужно также зарегистрировать его в операционной системе и связать его с видом файлов, которые он может обрабатывать. Шаги установки и регистрации отличаются для каждого фильтра. Прочтите документацию к фильтрам IFilter для дополнительной информации.

См. также

Понятия

Фильтры IFilter и обработчики протокола (Office SharePoint Server 2007)
Установка пакета фильтров Microsoft (Office SharePoint Server 2007)
Об обработчиках протокола (Office SharePoint Server 2007)