О фильтрах IFilter (Search Server 2008)
Обновлено: 2009-04-16
Примечание: |
---|
Если не указано иное, содержащаяся в данной статье информация относится как к серверу Microsoft Search Server 2008, так и к серверу Microsoft Search Server 2008 Express. |
Перед добавлением контента, содержащегося в каждом обходимом файле, в индекс контента, необходимо удалить из контента знаки форматирования. Форматирование файла зависит от приложения, в котором он был создан. Например, формат документов Microsoft Office Word отличается от форматов слайдов Microsoft Office PowerPoint. Механизм индексирования Search Server 2008 использует фильтры IFilter для удаления элементов форматирования из контента, извлекаемого из элементов в процессе обхода.
В следующей таблице описаны действия, выполняемые системой индексирования в зависимости от наличия фильтра IFilter, установленного на сервере индексирования, и присутствия типа файла на странице "Управление типами файлов" в администрировании поиска.
Установлен фильтр IFilter? | Тип файла указан на странице "Управление типами файлов"? | Результат |
---|---|---|
Да |
Да |
Индексируется контент файла и его свойства. |
Нет |
Да |
Контент файла не индексируется, но индексируются его свойства. |
Нет |
Нет |
Не индексируются ни контент файла, ни его свойства. |
Фильтры IFilter и типы файлов
Каждый фильтр IFilter должен быть связан с типом файлов, для которого возможна фильтрация. Тип файла определяется расширением из трех или четырех букв. Список типов файлов, для которых в Поисковый сервер установлен фильтр IFilter, можно просмотреть на странице "Управление типами файлов" в администрировании поиска. Если нужно выполнить обход для файла, типу которого не соответствует ни один фильтр IFilter, то в индекс контента в Поисковый сервер могут включаться только свойства файла, но не его контент. Чтобы индексировать контент, для которого по умолчанию не установлен фильтр IFilter, необходимо установить и зарегистрировать фильтр IFilter для этого типа файлов.
В следующей таблице перечислены стандартные параметры на странице "Управление типами файлов". Сюда входят типы файлов, поддерживаемые IFilter, но не включенные по умолчанию. Кроме того, для некоторых типов файлов, указанных на странице "Управление типами файлов", по умолчанию нет поддержки IFilter. Сведения об обновлении страницы "Управление типами файлов" см. в разделе Указание типов файлов для обхода (Search Server 2008).
Расширение имени файла | Поддержка IFilter по умолчанию | Включение типа файлов по умолчанию |
---|---|---|
ascx |
Да |
Да |
asm |
Да |
Нет |
asp |
Да |
Да |
aspx |
Да |
Да |
bat |
Да |
Нет |
c |
Да |
Нет |
cmd |
Да |
Нет |
cpp |
Да |
Нет |
css |
Да |
Нет |
cxx |
Да |
Нет |
def |
Да |
Нет |
dic |
Да |
Нет |
doc |
Да |
Да |
docm |
Да |
Да |
docx |
Да |
Да |
dot |
Да |
Да |
eml |
Да |
Да |
exch |
Нет |
Да |
h |
Да |
Нет |
hhc |
Да |
Нет |
hht |
Да |
Нет |
hpp |
Да |
Нет |
hta |
Да |
Нет |
htm |
Да |
Да |
html |
Да |
Да |
htw |
Да |
Нет |
htx |
Да |
Нет |
jhtml |
Нет |
Да |
jsp |
Нет |
Да |
lnk |
Да |
Нет |
mht |
Да |
Да |
mhtml |
Да |
Да |
mpx |
Да |
Нет |
msg |
Да |
Да |
mspx |
Нет |
Да |
nsf |
Нет |
Да |
odc |
Да |
Да |
one |
Нет |
Нет |
php |
Нет |
Да |
pot |
Да |
Нет |
pps |
Да |
Нет |
ppt |
Да |
Да |
pptm |
Да |
Да |
pptx |
Да |
Да |
pub |
Да |
Да |
stm |
Да |
Нет |
tif |
Да |
Да |
tiff |
Нет |
Да |
trf |
Да |
Нет |
txt |
Да |
Да |
url |
Нет |
Да |
vdx |
Нет |
Да |
vsd |
Нет |
Да |
vss |
Нет |
Да |
vst |
Нет |
Да |
vsx |
Нет |
Да |
vtx |
Нет |
Да |
xlb |
Да |
Нет |
xlc |
Да |
Нет |
xls |
Да |
Да |
xlsm |
Да |
Да |
xlxs |
Да |
Да |
xlt |
Да |
Нет |
xml |
Да |
Да |
Примечание: |
---|
Фильтры IFilter, которые позволяют Office SharePoint Server 2007 индексировать файлы формата Adobe PDF, предоставляются корпорацией Adobe. Дополнительные сведения об установке и настройке таких фильтров IFilter см. на странице Icons are not displayed for Adobe PDF documents that are listed in the search results when you search your portal site in SharePoint Portal Server 2003 or in SharePoint Server 2007 (на английском языке) (https://go.microsoft.com/fwlink/?linkid=144596&clcid=0x419, на английском языке). |
Microsoft Filter Pack
Корпорация Майкрософт предлагает пакет фильтров с набором фильтров IFilter, которые дополняют фильтры IFilter, автоматически устанавливаемые с Search Server 2008. Пакет Microsoft Filter Pack устанавливает и регистрирует фильтры IFilter для следующих форматов файлов: DOCX, DOCM, PPTX, PPTM, XLSX, XLSM, XLSB, ZIP, ONE, VDX, VSD, VSS, VST, VDX, VSX и VTX.
Дополнительные сведения см. в разделе Установка пакета фильтров Microsoft (Search Server 2008).
Настраиваемые фильтры
Если нужно выполнить обход документов, тип файла которых не поддерживается фильтром IFilter, входящим в состав Поисковый сервер или в пакет Microsoft Filter Pack, необходимо установить соответствующий фильтр IFilter на сервере индексирования. Обратитесь к компании, создавшей приложение, чтобы узнать, имеется ли фильтр IFilter для продуктов поиска Майкрософт. Если приложение создается в рамках организации, то разработчики ПО, занимающиеся разработкой или сопровождением приложения, могут создать для него фильтр IFilter. Дополнительные сведения см. в разделе Пакет средств разработки ПО для Microsoft Search Server 2008 (на английском языке) (https://go.microsoft.com/fwlink/?linkid=141179&clcid=0x419) (на английском языке).
После установки фильтра IFilter также необходимо зарегистрировать его в операционной системе и связать с типом файлов, которые он может обрабатывать. Действия по установки и регистрации различаются в зависимости от фильтра IFilter. Дополнительные сведения см. в документации по IFilter.
См. также
Понятия
Установка пакета фильтров Microsoft (Search Server 2008)
Об обработчиках протокола (Search Server 2008)