Planejar rastreamento e federação (SharePoint Server 2010)

Artigo
03/07/2017

Aplica-se a: SharePoint Server 2010

Tópico modificado em: 2016-11-30

Antes que os usuários finais possam usar a funcionalidade de pesquisa corporativa no Microsoft SharePoint Server 2010, você deve rastrear ou federar o conteúdo que deseja disponibilizar para a pesquisa dos usuários. O planejamento do rastreamento ou da federação inclui as seguintes tarefas:

Planejar fontes de conteúdo
Planejar inclusões de tipo de arquivo e IFilters
Plano de autenticação
Planejar conectores
Planejar o gerenciamento do impacto do rastreamento
Planejar regras de rastreamento
Planejar configurações de pesquisa gerenciadas no nível do farm
Plano de federação

Planejar fontes de conteúdo

Uma fonte de conteúdo é um conjunto de opções que você pode usar para especificar que tipo de conteúdo será rastreado, que URLs rastrear e com qual profundidade e quando será feito o rastreamento. A fonte de conteúdo padrão é Sites locais do SharePoint. É possível usar essa fonte de conteúdo para especificar como rastrear todo o conteúdo em todos os aplicativos Web associados a um aplicativo de serviço de Pesquisa. Por padrão, para cada aplicativo Web que usa um aplicativo de serviço de Pesquisa específico, o SharePoint Server 2010 adiciona o endereço inicial do site de nível superior de cada conjunto de sites à fonte de conteúdo padrão.

Algumas organizações podem usar a fonte de conteúdo padrão para satisfazer seus requisitos de pesquisa. No entanto, muitas organizações precisam ter fontes de conteúdo adicionais. Planeje fontes de conteúdo adicionais quando tiver de fazer o seguinte:

Rastrear tipos de conteúdo diferentes — por exemplo, sites do SharePoint, compartilhamentos de arquivo e dados corporativos.
Rastrear parte do conteúdo em cronogramas diferentes de outras partes de conteúdo.
Limitar ou aumentar a quantidade do conteúdo rastreado.
Definir prioridades diferentes para o rastreamento de sites diferentes.

Você pode criar até 500 fontes de conteúdo em cada aplicativo de serviço de Pesquisa e cada fonte de conteúdo pode conter até 500 endereços iniciais. Para simplificar ao máximo a administração, recomendamos que você limite o número de fontes de conteúdo criadas.

Planejar o rastreamento de diferentes tipos de conteúdo

Você só pode rastrear um tipo de conteúdo por fonte de conteúdo. Ou seja, é possível criar uma fonte de conteúdo que contenha endereços iniciais para sites do SharePoint e outra fonte de conteúdo que contenha endereços iniciais para compartilhamentos de arquivo. No entanto, não é possível criar uma única fonte de conteúdo que contenha endereços iniciais para sites do SharePoint e compartilhamentos de arquivos. A tabela a seguir relaciona os tipos de fontes de conteúdo que você pode configurar:

Use este tipo de fonte de conteúdo	Para este conteúdo
Sites do SharePoint	Sites do SharePoint do mesmo farm ou de farms diferentes do Microsoft SharePoint Server 2010, do Microsoft SharePoint Foundation 2010 ou do Servidor de Pesquisa da Microsoft 2010 Sites do SharePoint do mesmo farm ou de farms diferentes do Microsoft Office SharePoint Server 2007, do Windows SharePoint Services 3,0 ou do Servidor de Pesquisa da Microsoft 2008 Sites do SharePoint de farms do Microsoft Office SharePoint Portal Server 2003 ou do Windows SharePoint Services 2.0 Observação Ao contrário do rastreamento de sites do SharePoint no SharePoint Server 2010, no SharePoint Foundation 2010 ou no Search Server 2010, o rastreador não pode rastrear automaticamente todos os subsites de um conjunto de sites de versões anteriores dos Produtos e Tecnologias do SharePoint. Dessa forma, ao rastrear sites do Sharepoint de versões anteriores, você deverá especificar o endereço inicial de todos os sites de nível superior e a URL de todos os subsites que deseja rastrear.
Sites	Outro conteúdo da Web em sua organização que não esteja localizado em sites do SharePoint Conteúdo de sites na Internet
Compartilhamentos de arquivos	Conteúdo de compartilhamentos de arquivos na sua organização
Pastas públicas do Exchange	Conteúdo do Microsoft Exchange Server
Lotus Notes	Mensagens de email armazenadas em bancos de dados do Lotus Notes Observação Ao contrário de todos os outros tipos de fontes de conteúdo, a opção de fonte de conteúdo do Lotus Notes não aparecerá na interface do usuário até você instalar e configurar o software de pré-requisito apropriado. Para obter mais informações, consulte Configure and use the Lotus Notes connector (SharePoint Server 2010).
Dados corporativos	Dados corporativos armazenados em aplicativos de linha de negócios

Planejar fontes de conteúdo para dados corporativos

As fontes de conteúdo de dados corporativos exigem que os aplicativos que estejam hospedando os dados sejam especificados em um Modelo de Aplicativo em um aplicativo de serviço de Conectividade de Dados Corporativos, ou você pode criar fontes de conteúdo separadas para rastrear aplicativos individuais.

Com frequência, as pessoas que planejam a integração de dados corporativos a conjuntos de sites não são as mesmas pessoas envolvidas no processo de planejamento de conteúdo geral. Dessa forma, inclua os administradores de aplicativos de negócios nas equipes de planejamento de conteúdo de forma que eles possam aconselhar você sobre como integrar os dados de aplicativo de negócios ao conteúdo e apresentá-los com eficiência nos conjuntos de sites.

Rastrear conteúdo em cronogramas diferentes

Você deve decidir se parte do conteúdo será rastreada com mais frequência do que outra. Quanto maior o volume de conteúdo rastreado, mais provável será o rastreamento de conteúdo de repositórios de conteúdo diferentes. O conteúdo poderá não ser do mesmo tipo e poderá estar localizado em servidores com capacidades variadas. Esses fatores fazem com que seja mais provável a necessidade de adicionar fontes de conteúdo para o rastreamento dos diferentes repositórios de conteúdo em cronogramas diferentes.

Os principais motivos para o rastreamento de conteúdo em cronogramas diferentes são os seguintes:

Para acomodar tempos de inatividade e períodos de uso máximo.
Quanto mais o conteúdo for rastreado, mais ele será atualizado.
Para rastrear o conteúdo localizado em servidores mais lentos separadamente do conteúdo localizado em servidores mais rápidos.

Em muitos casos, nem todas essas informações podem ser conhecidas até que o SharePoint Server 2010 seja implantado e tenha sido executado por algum tempo. Em alguns casos, você deverá especificar cronogramas de rastreamento depois que o farm estiver em produção. Não obstante, é uma boa ideia considerar esses fatores durante o planejamento para que você possa planejar cronogramas de rastreamento com base nas informações que possui.

As duas seções a seguir oferecem mais informações sobre o rastreamento em cronogramas diferentes.

Considerações sobre o planejamento de cronogramas de rastreamento

Você pode configurar cronogramas de rastreamento de forma independente para cada fonte de conteúdo. Para cada fonte de conteúdo, é possível especificar um horário para realizar rastreamentos completos e um horário separado para realizar rastreamentos incrementais. Observe que você deve executar um rastreamento completo para uma fonte de conteúdo em particular antes de poder executar um rastreamento incremental. Mesmo se você especificar um rastreamento incremental para conteúdo que ainda não tenha sido rastreado, o sistema executará um rastreamento completo.

Observação

Como o rastreamento completo rastreia todo o conteúdo encontrado pelo rastreador e para o qual tenha pelo menos o acesso de leitura, quer o conteúdo tenha sido rastreado antes ou não, esse tipo de rastreamento pode demorar muito mais do que os rastreamentos incrementais.

Recomendamos que você planeje cronogramas de rastreamento com base em considerações de disponibilidade, desempenho e largura de banda dos servidores de rastreamento e de consulta.

Ao planejar seus cronogramas de rastreamento, considere as seguintes práticas recomendadas:

Agrupe endereços iniciais em fontes de conteúdo com base em disponibilidade similar e com o uso de recursos gerais aceitáveis para servidores que estejam hospedando o conteúdo.
Agende rastreamentos incrementais para cada fonte de conteúdo durante os horários em que os servidores que hospedam o conteúdo estejam disponíveis e quando houver uma baixa demanda dos recursos do servidor.
Faça o balanceamento de cronogramas de rastreamento de forma que a carga nos servidores do farm seja distribuída pelo tempo.
Agende rastreamentos completos somente quando for necessário, pelos motivos relacionados na próxima seção. Recomendamos que você execute rastreamentos completos com menos frequência do que rastreamentos incrementais.
Agende alterações administrativas que exijam um rastreamento completo para que ocorram imediatamente antes do cronograma planejado para rastreamentos completos. Por exemplo, recomendamos que você agende a criação de uma regra de rastreamento antes do próximo rastreamento completo agendado de forma que um rastreamento completo adicional não seja necessário.
Baseie os rastreamentos simultâneos na capacidade disponível. Para obter o melhor desempenho, recomendamos que você faça o balanceamento dos cronogramas de rastreamento das fontes de conteúdo. Você poderá otimizar os cronogramas de rastreamento com o tempo, à medida que ficar mais acostumado com as durações típicas dos rastreamentos para cada fonte de conteúdo.

Motivos para realizar um rastreamento completo

Os motivos para que um administrador de aplicativo de serviço de Pesquisa realize um rastreamento completo incluem:

Uma atualização de software ou service pack foi instalado em servidores do farm. Consulte as instruções da atualização de software ou do service pack para obter mais informações.
Um administrador de serviços compartilhados do Microsoft Office SharePoint Server 2007 ou um administrador de aplicativo de serviço de Pesquisa do SharePoint Server 2010 adicionou uma nova propriedade gerenciada. Um rastreamento completo é necessário para que a nova propriedade gerenciada entre em vigor imediatamente. Se você não quiser que a nova propriedade gerenciada entre em vigor imediatamente, não será necessário realizar um rastreamento completo.
Você deseja reindexar páginas ASPX em sites do Windows SharePoint Services 3,0 ou do Microsoft Office SharePoint Server 2007.

Observação

O rastreador não consegue descobrir quando páginas ASPX em sites do Windows SharePoint Services 3,0 ou Office SharePoint Server 2007 foram alteradas. Por causa disso, os rastreamentos incrementais não reindexam modos de exibição ou home pages quando itens de lista individuais são excluídos. Recomendamos que você realize periodicamente rastreamentos completos de sites que contenham arquivos ASPX para garantir que essas páginas sejam reindexadas.
Você deseja resolver falhas consecutivas de rastreamento incremental. Se um rastreamento incremental falhar cem vezes consecutivas em qualquer nível em um repositório, o sistema removerá o conteúdo afetado do índice.
Regras de rastreamento foram adicionadas, excluídas ou modificadas.
Você deseja reparar um índice corrompido.
O administrador do aplicativo de serviço de Pesquisa criou um ou mais mapeamentos de nome de servidor.
As credenciais da conta de usuário atribuídas à conta de acesso ao conteúdo ou a uma regra de rastreamento foram alteradas.

O sistema realiza um rastreamento completo mesmo quando um rastreamento incremental é solicitado sob as seguintes circunstâncias:

Um administrador de pesquisa parou o rastreamento anterior.
Um banco de dados de conteúdo foi restaurado ou um administrador do farm desanexou e reanexou um banco de dados de conteúdo.

Observação

Se você estiver executando o Office SharePoint Server 2007 com o Atualização de Infraestrutura para os Microsoft Office Servers ou com o SharePoint Server 2010, poderá usar a operação de restauração da ferramenta de linha de comando Stsadm para alterar a opção de a restauração do banco de dados de conteúdo poder ou não causar um rastreamento completo.
Um rastreamento completo do site nunca foi feito a partir deste aplicativo de serviço de Pesquisa.
O log de alteração não contém entradas para os endereços rastreados. Sem entradas no log de alteração para os itens rastreados, os rastreamentos incrementais não poderão ocorrer.

Você pode ajustar cronogramas após a implantação inicial com base no desempenho e na capacidade de servidores no farm e dos servidores que hospedam conteúdo.

Limite ou aumente a quantidade do conteúdo rastreado

Para cada fonte de conteúdo, você pode especificar com que extensão deseja rastrear os endereços iniciais. Também pode especificar o comportamento do rastreamento alterando as configurações do rastreamento. As opções disponíveis para uma fonte de conteúdo em particular variam com base no tipo de fonte de conteúdo selecionado. Entretanto, a maioria das opções de rastreamento especifica quantos níveis da hierarquia a partir do endereço inicial deverão ser rastreados. Observe que esse comportamento é aplicado a todos os endereços iniciais em uma determinada fonte de conteúdo. Se você tiver de rastrear alguns sites em níveis mais profundos, poderá criar fontes de conteúdo adicionais que os incluam.

Você pode usar opções de definição de rastreamento para limitar ou aumentar a quantidade de conteúdo rastreado. As opções disponíveis nas propriedades para cada fonte de conteúdo variam dependendo do tipo de fonte de conteúdo selecionado. A tabela a seguir descreve as práticas recomendadas durante a definição de opções de configuração de rastreamento.

Para este tipo de fonte de conteúdo	Se isto estiver relacionado	Use esta opção de configuração de rastreamento
Sites do SharePoint	Você deseja incluir o conteúdo do próprio site e não deseja incluir o conteúdo dos subsites, ou deseja rastrear o conteúdo dos subsites em um cronograma diferente.	Rastrear somente o site do SharePoint de cada endereço inicial
Sites do SharePoint	Você deseja incluir o conteúdo do site. - ou - Você deseja rastrear todo o conteúdo sob o endereço inicial no mesmo cronograma.	Rastrear tudo sob o nome do host de cada endereço inicial
Sites	Não for provável que o conteúdo disponível em sites vinculados seja relevante.	Rastrear somente no servidor de cada endereço inicial
Sites	O conteúdo relevante está localizado somente na primeira página.	Rastrear somente a primeira página de cada endereço inicial
Sites	Você deseja limitar a profundidade de rastreamento dos links nos endereços iniciais.	Personalizado — especifique o número de páginas e o número de saltos de servidor a rastrear Observação Para um site altamente conectado, recomendamos começar com um número pequeno, porque especificar mais de três páginas de profundidade ou mais de três saltos de servidor pode resultar no rastreamento de toda a Internet.
Compartilhamentos de arquivos Pastas públicas do Exchange	É improvável que o conteúdo disponível nas subpastas seja relevante.	Rastrear somente a pasta de cada endereço inicial
Compartilhamentos de arquivos Pastas públicas do Exchange	É provável que o conteúdo das subpastas seja relevante.	Rastrear a pasta e as subpastas de cada endereço inicial
Dados corporativos	Todos os aplicativos registrados no repositório de metadados do BDC possuem conteúdo relevante.	Rastrear todo o repositório de metadados do BDC
Dados corporativos	Nem todos os aplicativos registrados no repositório de metadados do BDC possuem conteúdo relevante. - ou - Você deseja rastrear alguns aplicativos em um cronograma diferente.	Rastrear aplicativos selecionados

Outras considerações durante o planejamento de fontes de conteúdo

Você não pode rastrear os mesmos endereços iniciais usando várias fontes de conteúdo no mesmo aplicativo de serviço de Pesquisa. Por exemplo, se você usar uma fonte de conteúdo em particular para rastrear um conjunto de sites e todos seus subsites, não poderá usar uma fonte de conteúdo diferente para rastrear um desses subsites separadamente em um cronograma diferente.

Além de considerar os cronogramas de rastreamento, sua decisão de agrupar endereços iniciais em uma única fonte de conteúdo ou de criar fontes de conteúdo adicionais dependerá muito de considerações administrativas. Com frequência, os administradores fazem alterações para atualizar uma fonte de conteúdo em particular. A alteração de uma fonte de conteúdo requer o rastreamento completo do repositório de conteúdo especificado nessa fonte de conteúdo. Para facilitar a administração, organize fontes de conteúdo de forma que a atualização de fontes de conteúdo, regras de rastreamento e cronogramas de rastreamento seja conveniente para os administradores.

Planejar inclusões de tipo de arquivo e IFilters

O conteúdo só será rastreado se a extensão de nome de arquivo relevante estiver incluída nas listas de inclusões de tipo de arquivo e se um IFilter estiver instalado no servidor de rastreamento que oferece suporte a esses tipos de arquivo. Vários tipos de arquivo e IFilters são incluídos automaticamente durante a instalação inicial. Quando você planejar fontes de conteúdo em sua implantação inicial, determine se o conteúdo que você deseja rastrear usa tipos de arquivo que não estão incluídos. Se os tipos de arquivo não estiverem incluídos, adicione-os na página Gerenciar Tipos de Arquivo durante a implantação e verifique se há um IFilter instalado e registrado para oferecer suporte a esse tipo de arquivo.

Se quiser excluir determinados tipos de arquivo do rastreamento, você poderá excluir a extensão de nome de arquivo para esse tipo de arquivo da lista de inclusões de tipo de arquivo. Isso excluirá os nomes de arquivo com essa extensão do rastreamento. Para obter uma lista de tipos de arquivo e de IFilters instalados por padrão, consulte File types and IFilters reference (SharePoint Server 2010).

Plano de autenticação

Quando o rastreador acessar os endereços iniciais listados em fontes de conteúdo, deverá ser autenticado pelos servidores que hospedam esse conteúdo e obter acesso a eles. Isso significa que a conta do domínio usada pelo rastreador deverá ter pelo menos permissões de leitura para o conteúdo.

Por padrão, o sistema usa a conta padrão de acesso a conteúdo. Como alternativa, você poderá usar regras de rastreamento para especificar uma conta de acesso a conteúdo diferente para quando for rastrear um conteúdo em particular. Usando uma conta de acesso a conteúdo padrão ou uma conta de acesso a conteúdo diferente especificada por uma regra de rastreamento, a conta de acesso a conteúdo usada deverá ter permissões de leitura para o conteúdo rastreado. Se a conta de acesso a conteúdo não tiver permissões de leitura, o conteúdo não será rastreado, não será indexado e, portanto, não estará disponível para consultas.

Recomendamos que a conta especificada como conta de acesso a conteúdo padrão tenha acesso à maior parte do seu conteúdo rastreado. Só utilize outras contas de acesso a conteúdo quando as considerações de segurança exigirem contas de acesso a conteúdo separadas.

Para cada fonte de conteúdo que planejar, determine os endereços iniciais que não podem ser acessados pela conta de acesso a conteúdo padrão e planeje a adição de regras de rastreamento para esses endereços iniciais.

Importante

Verifique se a conta de domínio usada para a conta de acesso a conteúdo padrão ou para qualquer outra conta de acesso a conteúdo não seja igual à conta de domínio usada por um pool de aplicativos associado a qualquer aplicativo Web rastreado. Isso poderia fazer com que conteúdo não publicado nos sites do SharePoint e versões secundárias de arquivos (ou seja, o histórico) em sites do SharePoint fosse rastreado e indexado.

Outra consideração importante é que o rastreador deve usar o mesmo protocolo de autenticação do servidor host. Por padrão, o rastreador é autenticado usando NTML. Você pode configurá-lo para usar um protocolo de autenticação diferente, se necessário.

Se estiver usando a autenticação baseada em declarações, verifique se a autenticação do Windows está habilitada em qualquer aplicativo Web a ser rastreado.

Planejar conectores

Todo o conteúdo rastreado exige que você use um conector (conhecido como manipulador de protocolo em versões anteriores) para obter acesso a esse conteúdo. O SharePoint Server 2010 oferece conectores para todos os protocolos comuns da Internet. No entanto, se você quiser rastrear conteúdo que exija um conector que não esteja instalado no SharePoint Server 2010, deverá instalar o conector de terceiros ou personalizado antes de poder rastrear esse conteúdo. Para obter uma lista de conectores instalados por padrão, consulte Default connectors (SharePoint Server 2010). Para obter informações sobre como instalar conectores, consulte Instalar conectores (SharePoint Server 2010).

Planejar o gerenciamento do impacto do rastreamento

O rastreamento de conteúdo pode diminuir significativamente o desempenho dos servidores que hospedam o conteúdo. O impacto que isso tem em determinados servidores varia, dependendo da carga que o servidor host estiver experimentando e se o servidor tem recursos suficientes (especialmente CPU e RAM) para manter contratos de nível de serviço sob uso comum ou máximo.

Os administradores de pesquisa podem usar as regras de impacto do rastreador para gerenciar o impacto do rastreador nos servidores rastreados. Para cada regra de impacto do rastreador, você pode especificar uma única URL ou usar caracteres curinga no caminho da URL para incluir um bloco de URLs ao qual a regra se aplica. Então, você pode especificar quantas solicitações simultâneas de páginas são feitas para a URL especificada ou decidir solicitar somente um documento por vez e aguardar alguns segundos à sua escolha entre solicitações.

As regras de impacto do rastreador especificam a taxa na qual o rastreador solicita conteúdo de um determinado endereço inicial ou o intervalo de endereços iniciais (também conhecido como um nome do site). Uma regra de impacto do rastreador se aplica a todas as fontes de conteúdo no aplicativo de serviço de Pesquisa e as frequências de solicitação se aplicam por componente de rastreamento. A tabela a seguir mostra os caracteres curingas que você pode usar no nome do site quando estiver adicionando ou editando uma regra de impacto do rastreador.

Este caractere curinga	Tem este resultado
* como o nome do site	Aplica a regra a todos os sites.
. como o nome do site	Aplica a regra a sites com pontos no nome.
*.nome_do_site.com como o nome do site	Aplica a regra a todos os sites no domínio nome_do_site.com (por exemplo, *.adventure-works.com).
*.nome_de_domínio_de_nível_superior como o nome do site	Aplica a regra a todos os sites que terminam com um nome de domínio de primeiro nível específico, por exemplo, .com ou .net.
?	Substitui um único caractere em uma regra. Por exemplo, *.adventure-works?.com se aplica a todos os sites nos domínios adventure-works1.com, adventure-works2.com e assim por diante.

Você pode criar uma regra de impacto do rastreador que se aplique a todos os sites em um domínio de primeiro nível em particular. Por exemplo, *.com se aplica a todos os sites da Internet com endereços que terminam em .com. Por exemplo, um administrador de um site de portal poderia adicionar uma fonte de conteúdo para samples.microsoft.com. A regra para *.com se aplica a esse site, a menos que você adicione uma regra de impacto do rastreador para samples.microsoft.com.

Você pode coordenar-se com administradores de sistemas de pesquisa que estejam rastreando conteúdo em sua organização para definir regras de impacto do rastreador baseadas no desempenho e na capacidade dos servidores. Para sites mais externos, essa coordenação não é possível. A solicitação de conteúdo excessivo em servidores externos ou a realização de solicitações com muita frequência pode fazer com que os administradores desses sites limitem o acesso caso os rastreamentos estejam usando recursos em excesso. Durante a implantação inicial, defina as regras de impacto do rastreador para minimizar ao máximo o impacto em outros servidores e, ao mesmo tempo, rastrear conteúdo com frequência suficiente para garantir que a atualização do índice atenda ao seu contrato de nível de serviço. Quando o farm estiver em produção, você poderá ajustar as regras de impacto do rastreador com base em dados de logs de rastreamento.

Planejar regras de rastreamento

As regras de rastreamento se aplicam a todas as fontes de conteúdo no aplicativo de serviço de pesquisa. Você pode aplicar regras de rastreamento a uma URL ou a um conjunto de URLs em particular para fazer o seguinte:

Evitar o rastreamento de conteúdo irrelevante excluindo uma ou mais URLs. Isso também ajuda a reduzir o uso de recursos de servidor e o tráfego de rede e a aumentar a relevância de resultados da pesquisa.
Rastrear links na URL sem o rastreamento da própria URL. Essa opção é útil para sites com links de conteúdo relevante quando a página que contém os links não contiver informações relevantes.
Permitir que URLs complexas sejam rastreadas. Essa opção direciona o sistema para rastrear URLs que contenham um parâmetro de consulta especificado com um ponto de interrogação. Dependendo do site, essas URLs podem não incluir conteúdo relevante. Como as URLs complexas com frequência podem redirecionar para sites irrelevantes, é uma boa ideia habilitar essa opção somente nos sites onde você saiba que o conteúdo disponível a partir de URLs complexas é relevante.
Permitir que o conteúdo de sites do SharePoint seja rastreado como páginas HTTP. Essa opção permite que o sistema rastreie sites do SharePoint que estejam atrás de um firewall ou em cenários nos quais o site rastreado restringe o acesso ao serviço Web usado pelo rastreador.
Especificar se a conta de acesso a conteúdo padrão, uma conta de acesso a conteúdo diferente ou um certificado de cliente será usado para o rastreamento de uma URL especificada.

Como o conteúdo de rastreamento consome recursos e largura de banda, é melhor incluir uma quantidade menor de conteúdo que reconhecidamente é relevante do que uma quantidade maior de conteúdo que pode ser irrelevante. Após a implantação inicial, você poderá analisar os logs de consulta e de rastreamento e ajustar fontes de conteúdo e regras de rastreamento para que sejam mais relevantes e incluam mais conteúdo.

Planejar configurações de pesquisa gerenciadas no nível do farm

Várias configurações que são gerenciadas no nível do farm afetam a forma como o conteúdo é rastreado. Considere as seguintes configurações de pesquisa no nível do farm quando estiver planejando o rastreamento:

Endereço de email do contato: o rastreamento de conteúdo afeta os recursos dos servidores que estão sendo rastreados. Antes de poder rastrear conteúdo, forneça nas configurações do endereço de email da pessoa em sua organização que os administradores poderão contatar caso o rastreamento tenha um impacto negativo nos servidores. Esse endereço de email aparecerá nos logs para administradores dos servidores rastreados para que eles possam contatar alguém caso o impacto do rastreamento no desempenho e na largura de banda seja muito grande ou se ocorrerem outros problemas.

O endereço de email de contato deve pertencer a uma pessoa com experiência e disponibilidade necessárias para responder às solicitações com rapidez. Alternativamente, você poderá usar um alias de lista de distribuição monitorado como endereço de email de contato. A despeito de o conteúdo rastreado ser armazenado internamente na organização ou não, a resposta rápida é importante.
Configurações do servidor de proxy: você pode optar por usar um servidor de proxy ao rastrear conteúdo. O servidor de proxy a ser usado dependerá da topologia da implantação do SharePoint Server 2010 e da arquitetura dos servidores da sua organização. Provavelmente, você terá de usar um servidor de proxy ao rastrear conteúdo da Internet. Para obter mais informações sobre como configurar o servidor proxy para pesquisa, consulte Configure farm-level proxy server settings (SharePoint Server 2010) e Configure proxy server settings for search (SharePoint Server 2010).
Configurações de tempo limite: as configurações de tempo limite são usadas para limitar o tempo que o sistema de pesquisa aguarda durante a conexão a outros serviços.
Configuração do SSL: a configuração do SSL (Secure Sockets Layer) determina se o certificado SSL deverá corresponder exatamente ao conteúdo do rastreamento.

Plano de federação

A pesquisa federada é consulta simultânea de vários recursos da Web ou de bancos de dados para a geração de uma única página de resultados da pesquisa para usuários finais. Quando você usa um local federado, os usuários finais podem pesquisar e recuperar conteúdo que não tenha sido rastreado por servidores no sistema local. Os locais federados permitem que consultas sejam enviadas a mecanismos de pesquisa e feeds remotos. Consequentemente, o sistema renderiza os resultados para usuários finais como se o conteúdo federado fosse parte do conteúdo rastreado.

O SharePoint Server 2010 oferece suporte aos seguintes tipos de locais federados:

Índice de pesquisa neste servidor. Você pode usar qualquer site local ou remoto da sua organização que tenha um servidor que esteja executando o SharePoint Server 2010 como um local federado. Por exemplo, imagine que um site do SharePoint em um servidor de Recursos Humanos em sua empresa seja a única fonte disponível de informações de contato de funcionários. Mesmo se o site não fizer parte do seu escopo de rastreamento, você poderá configurar um local federado para ele de forma que os usuários que iniciarem uma pesquisa a partir do seu site do Centro de Pesquisa possam recuperar resultados de informações de contato de funcionários para os quais tenham autorização de ver. As seguintes condições se aplicam:
1. O local é definido como Pesquisar Índice neste Servidor.
2. Nenhum modelo de consulta é necessário. O SharePoint Server 2010 usa o modelo de objeto para consultar um local.
3. A autenticação de servidor padrão é usada.
4. As consultas de pesquisa avançada não têm suporte.
OpenSearch 1.0 ou 1.1. Você pode usar qualquer site público que ofereça suporte a OpenSearch padrão como um local federado. Um exemplo de tal local é um mecanismo de pesquisa da Internet como o Bing, ou uma página de resultados da pesquisa que ofereça suporte aos protocolos RSS ou Atom. Por exemplo, imagine que você queira que os usuários que pesquisam seus sites internos em busca de pesquisas técnicas proprietárias possam consultar informações de pesquisa relacionadas em sites públicos. Ao configurar um local federado para uma consulta de pesquisa do Bing, os resultados da pesquisa da Web serão automaticamente incluídos para os usuários. As seguintes condições se aplicam:
1. As consultas podem ser enviadas a um mecanismo de pesquisa como uma URL, como http://www.example.com/search.aspx?q=TEST.
2. Os resultados da pesquisa são retornados em RSS, Atom ou outro formato XML estruturado.
3. Os recursos de local, modelos de consulta e elementos de resposta fazem parte de uma descrição de arquivo OpenSearch (.osdx) associada ao local.
4. As extensões do OpenSearch específicas do SharePoint Server 2010 oferecem suporte à capacidade de incluir gatilhos e à capacidade de associar código XSL a resultados da pesquisa.
5. A opção de exibição dos metadados nos resultados da pesquisa é determinada pelo local do OpenSearch.
Para obter mais informações sobre o OpenSearch, consulte https://www.opensearch.org.

Quando uma consulta de pesquisa é enviada a um local federado, ela é enviada como parâmetros de URL em um formato chamado de modelo de consulta. Em seguida, o sistema formata e renderiza os resultados como XML para usuários do site do Centro de Pesquisa. O XML é exibido em uma Web Part na página de resultados da pesquisa como texto legível. Você pode adicionar e configurar Web Parts na página de resultados da pesquisa, como uma Web Part de Resultados de Pesquisa Federada, uma Web Part de Principais Resultados Federados ou uma Web Part de Principais Resultados. Por padrão, a página de resultados da pesquisa contém três Web Parts de Resultados da Pesquisa Federados.

Considere as seguintes perguntas quando estiver determinando se deseja exibir resultados da pesquisa federados para usuários:

Você deseja exibir resultados personalizados para pesquisas em particular? Para ajudar a garantir que o local federado retorne resultados que correspondam a consultas específicas, você poderá usar regras de gatilho. Ao criar uma regra de gatilho para um local federado, a Web Part associada a esse local exibirá resultados somente para as consultas de usuário que correspondam ao padrão ou prefixo especificado por você.
Você pode usar uma URL para especificar que resultados devem ser recuperados em uma consulta? Para criar um local federado, você deverá especificar um modelo de consulta, que é a combinação da URL e dos parâmetros necessários para o envio de uma consulta de pesquisa e para o retorno dos resultados como XML. Quando você adicionar essas informações ao campo Modelo de consulta na página Adicionar Local Federado, deverá formatar a cadeia de caracteres corretamente (como mostrado no exemplo da página Adicionar Local Federado) ou o provedor de resultados da pesquisa não retornará qualquer resultado.
Os usuários podem acessar os links fornecidos pelo local federado? Se a sua organização conceder somente acesso limitado a recursos da Internet, o uso de um mecanismo de pesquisa da Internet como um local federado poderá frustrar os usuários, uma vez que eles não conseguirão exibir alguns resultados da pesquisa.
A autenticação é necessária? se o local federado exibir autenticação, você deverá fornecer as credenciais corretas. Muitos locais federados, como mecanismos de pesquisa da Internet, não exigem credenciais.

Planejar tipos de autenticação para federação

Vários tipos de autenticação do usuário, credenciais por usuário e comuns, estão disponíveis para a pesquisa federada. No entanto, perceba que a coleta de credenciais exige uma extensão de Web Part para tipos de autenticação não Kerberos na autenticação por usuário. Na seção de informações de autenticação e de credenciais da definição do local, especifique o tipo de autenticação para o local federado. O tipo de autenticação pode ser um destes:

Anônima

Nenhuma credencial é necessária para a conexão ao local federado.
Comum

Cada conexão usa o mesmo conjunto de credenciais para conectar ao local federado.
Por usuário

As credenciais do usuário que enviou a consulta de pesquisa são usadas para a conexão ao local federado.

Para os tipos de autenticação comum e por usuário, você também deverá especificar um dos seguintes protocolos de autenticação:

Básica

A autenticação básica faz parte da especificação HTTP e também tem o suporte da maioria dos navegadores.

Security Note
Os navegadores da Web que usam a autenticação Básica transmitem senhas que não são criptografadas. Ao monitorar as comunicações na rede, um usuário mal-intencionado pode usar ferramentas publicamente disponíveis para interceptar e decodificar essas senhas. Dessa forma, não recomendamos a autenticação Básica, a menos que você tenha certeza de que a conexão é segura, como uma linha dedicada ou uma conexão SSL (Secure Sockets Layer).

Os navegadores da Web que usam a autenticação Básica transmitem senhas que não são criptografadas. Ao monitorar as comunicações na rede, um usuário mal-intencionado pode usar ferramentas publicamente disponíveis para interceptar e decodificar essas senhas. Dessa forma, não recomendamos a autenticação Básica, a menos que você tenha certeza de que a conexão é segura, como uma linha dedicada ou uma conexão SSL (Secure Sockets Layer).

Digest

A autenticação Digest baseia-se no protocolo HTTP 1.1, conforme definido na especificação RFC 2617 no site do W3C (World Wide Web Consortium). Como a autenticação Digest exige compatibilidade com HTTP 1.1, alguns navegadores não possuem suporte a ela. Se um navegador que não for compatível com HTTP 1.1 solicitar um arquivo quando a autenticação Digest estiver habilitada, essa solicitação será rejeitada, uma vez que a autenticação Digest não tem o suporte do cliente. A autenticação Digest só poderá ser usada em domínios Windows. Ela só funciona com contas de domínio do Windows Server 2008, Windows Server 2003 e Microsoft Windows 2000 Server e pode exigir que as contas armazenem senhas como texto sem formatação criptografado.
NTLM

Os registros de usuário são armazenados no banco de dados do SAM (gerenciador de contas de segurança) ou no banco de dados do Active Directory. Cada conta de usuário é associada a duas senhas: a senha compatível com o LAN Manager e a senha do Windows. Cada senha é criptografada e armazenada no banco de dados do SAM ou no banco de dados do Active Directory.
Kerberos (somente para o tipo de autenticação por usuário)

Usando o protocolo Kerberos, uma parte em qualquer extremidade de uma conexão de rede pode verificar se a parte da outra extremidade é a entidade que declara ser. Embora o NTLM permita que os servidores verifiquem as identidades de seus clientes, o NTLM não permite que os clientes verifiquem a identidade de um servidor, nem que um servidor verifique a identidade de outro. A autenticação NTLM foi criada para um ambiente de rede no qual os servidores são supostamente confiáveis.
Baseada em formulários

Um cookie de autenticação baseada em formulários não é nada mais do que um contêiner para um tíquete de autenticação. Cada solicitação passa o tíquete como o valor do cookie, e o tíquete é usado no servidor para identificar um usuário autenticado. No entanto, a autenticação baseada em formulários sem cookies passa o tíquete na URL em um formato criptografado. A autenticação baseada em formulários sem cookies é usada porque navegadores clientes podem bloquear cookies. Esse recurso foi introduzido no Microsoft .NET Framework 2.0.

Se você estiver usando a autenticação baseada em declarações no seu ambiente, verifique se a autenticação do Windows também está habilitada em qualquer fonte de conteúdo a ser rastreada. Para obter mais informações sobre métodos de autenticação no SharePoint Server 2010, consulte Planejar métodos de autenticação (SharePoint Server 2010).

Partilhar via