Acerca de los orígenes de contenido (Search Server 2008)
Actualizado: 2009-04-28
Nota
A menos que se especifique lo contrario, la información de este artículo se aplica a Microsoft Search Server 2008 y Microsoft Search Server 2008 Express.
El contenido es cualquier elemento que se puede rastrear, como una página web, un documento de Microsoft Office Word, datos profesionales o un mensaje de correo electrónico. El contenido se incluye en un repositorio de contenido, como un sitio web, un recurso compartido de archivos o un sitio de SharePoint. Un origen de contenido especifica la configuración que define cómo y qué contenido programado se rastrea. Incluye una o más direcciones de un repositorio de contenido desde las que se inicia el rastreo, llamadas también direcciones de inicio. Esta configuración se aplica a todas las direcciones de inicio del origen de contenido completo.
Origen de contenido predeterminado
Si la organización necesita rastrear solo el contenido incluido en los sitios de SharePoint, es posible que no necesite crear un origen de contenido adicional. Search Server 2008 define un origen de contenido predeterminado durante la implementación inicial. El origen de contenido predeterminado se llama Local Office SharePoint Server sites. Las direcciones de inicio de todas las aplicaciones web de la granja de servidores se incluyen automáticamente como parte del origen de contenido predeterminado. Este origen de contenido no se rastrea de forma predeterminada. Para indizar el contenido del origen de contenido predeterminado, debe programar o iniciar manualmente los rastreos.
Creación de un nuevo origen de contenido
Al crear un origen de contenido, debe especificar la configuración que define el tipo de contenido que se va a rastrear, cuándo se rastrea el contenido y el comportamiento de rastreo, como la profundidad de rastreo en el espacio de nombres de la dirección de inicio o cuántos saltos de servidor se van a permitir. Si tiene varios tipos de repositorios de contenido que desea rastrear o si desea rastrear algunos repositorios de contenido con distintas programaciones, debe crear orígenes de contenido adicionales. Servidor de búsqueda incluye un proveedor de servicios compartidos (SSP) que admite hasta 500 orígenes de contenido. Para obtener más información, vea la sección acerca de la planeación de orígenes de contenido de Planeación del rastreo de contenido(Search Server 2008). Para obtener más información acerca de cómo configurar el comportamiento de rastreo, vea Limitación o aumento de la cantidad de contenido que se rastrea (Search Server 2008).
Tipos de repositorios de contenido
Sólo se puede rastrear un tipo de contenido por origen de contenido. Es decir, se puede crear un origen de contenido que incluya direcciones URL para sitios de SharePoint y otro que incluya direcciones URL para recursos compartidos de archivos, pero no se puede crear un solo origen de contenido que incluya direcciones URL para sitios de SharePoint y recursos compartidos de archivos.
En la siguiente tabla se indican los tipos de contenido que Servidor de búsqueda puede rastrear e indizar:
Este tipo de origen de contenido | Incluye este tipo de contenido |
---|---|
Sitios de SharePoint |
|
Sitios web |
|
Recursos compartidos de archivos |
|
Carpetas públicas de Exchange |
|
Lotus Notes |
|
Direcciones de inicio de contenido
Cada origen de contenido mantiene una lista de direcciones de inicio que el rastreador usa para establecer la conexión con el repositorio de contenido. Cada origen de contenido puede incluir hasta 500 direcciones de inicio. No puede rastrear las mismas direcciones con varios orígenes de contenido. Por ejemplo, si usa un origen de contenido concreto para rastrear una colección de sitios y todos sus subsitios, no puede usar otro origen de contenido para rastrear uno de estos subsitios con otra programación.
Rastreo de contenido
Puede usar un origen de contenido para iniciar manualmente un rastreo o programar cuándo y con qué frecuencia se va a rastrear el origen de contenido seleccionado. Si desea rastrear el contenido de una parte del origen de contenido con otra programación, debe crear un origen de contenido independiente para dicho contenido. Por motivos de rendimiento y facilidad de administración, se recomienda usar el menor número posible de orígenes de contenido. Para obtener más información acerca de cómo iniciar manualmente o programar un rastreo, vea Rastreo de contenido (Search Server 2008).
Autenticación
Cuando el rastreador obtiene acceso a las direcciones de inicio incluidas en un origen de contenido, los servidores que hospedan el contenido deben autenticar dicho rastreador y concederle acceso. La cuenta de usuario usada por el rastreador debe tener como mínimo permiso de lectura para poder rastrear el contenido. De forma predeterminada, Servidor de búsqueda usa la cuenta de acceso al contenido predeterminada y NTLM para la autenticación en los servidores. Para obtener más información, vea Definición del modo de autenticación del rastreador (Search Server 2008).
Vea también
Conceptos
Planeación del rastreo de contenido(Search Server 2008)
Configuración de las búsquedas para devolver resultados de entradas de blog (Search Server 2008)
Configuración de certificados de cliente para rastrear un sitio SSL (Search Server 2008)
Configuración de propiedades de elementos web (Search Server 2008)