IFilters e manipuladores de protocolo (Search Server 2008)
Atualizado em: 2009-04-16
Observação: |
---|
Exceto quando especificado, as informações neste artigo aplicam-se tanto ao Microsoft Search Server 2008 como ao Microsoft Search Server 2008 Express. |
O rastreador no Search Server 2008 usa manipuladores de protocolo para acessar conteúdo e os IFilters para extrair conteúdo dos arquivos que são rastreados. Os IFilters removem formatação específica de aplicativo antes de o mecanismo indexar o conteúdo de um documento. Somente tipos de arquivos para os quais estão instalados um manipulador de protocolo e um IFilter são rastreados pelo Servidor de Pesquisa.
Esta seção descreve os IFilters e manipuladores de protocolo incluídos por padrão em uma instalação do Servidor de Pesquisa, além de descrever como é possível instalar e registrar IFilters e manipuladores de protocolo adicionais.
O rastreador usa manipuladores de protocolo e IFilters da seguinte maneira:
O rastreador recupera os endereços iniciais das fontes de conteúdo e chama o manipulador de protocolo com base no prefixo da URL.
O manipulador de protocolo se conecta à fonte de conteúdo e extrai metadados de nível de sistema e informações de listas de controle de acesso.
O manipulador de protocolo identifica o tipo de arquivo para cada item de conteúdo, com base na extensão do nome do arquivo, e chama o IFilter apropriado associado a esse tipo de arquivo.
O IFilter extrai o conteúdo, removendo qualquer formatação incorporada, e recupera os metadados de itens de conteúdo.
O conteúdo é analisado por um ou mais separadores de palavras adequado ao idioma e é adicionado ao índice de texto completo, também chamado de índice de conteúdo. Os metadados e as listas de controle de acesso são adicionados ao banco de dados de pesquisa.
Nesta seção: