À propos des sources de contenu (Search Server 2008)
Mise à jour : 2009-04-28
Remarque : |
---|
Sauf indication contraire, les informations de cet article s'appliquent à Microsoft Search Server 2008 et à Microsoft Search Server 2008 Express. |
Le contenu peut être n’importe quel élément qui peut être analysé, tel qu’une page Web, un document Microsoft Office Word, des données métiers ou un message électronique. Le contenu se trouve dans un référentiel, par exemple un site Web, un partage de fichiers ou un site SharePoint. Une source de contenu spécifie les paramètres qui définissent la méthode et la fréquence de l’analyse du contenu. Elle comporte une ou plusieurs adresses d’un référentiel de contenu pour indiquer le début de l’analyse : ce sont les adresses de départ. Ces paramètres s’appliquent à toutes les adresses de départ situées dans la source de contenu.
Source de contenu par défaut
Si votre organisation a seulement besoin d’analyser le contenu des sites SharePoint, vous ne devez pas forcément créer une source de contenu supplémentaire. Search Server 2008 définit une source de contenu par défaut lors de son déploiement initial. La source de contenu par défaut porte ce nom : Local Office SharePoint Server sites. Les adresses de départ de toutes les applications Web de la batterie de serveurs sont automatiquement incluses comme éléments de la source de contenu par défaut. Par défaut, cette source de contenu par défaut n’est pas analysée. Pour en indexer le contenu, vous devez démarrer ou planifier manuellement des analyses.
Création d’une source de contenu
Lorsque vous créez une source de contenu, vous spécifiez des paramètres qui définissent le genre de contenu analysé, à quel moment le contenu est analysé et le comportement de l’analyse, notamment le degré de profondeur de l’analyse dans l’espace de noms de l’adresse de départ ou le nombre de tronçons de serveur autorisés. Si vous avez plusieurs genres de référentiels de contenu à analyser ou si vous souhaitez analyser des référentiels selon différentes planifications, vous devez créer des sources de contenu supplémentaires. Serveur de recherche possède un fournisseur de services partagés (SSP) qui prend en charge jusqu’à 500 sources de contenu. Pour plus d’informations, voir la section « Planifier les sources de contenu » dans Planification de l'analyse de contenu (Search Server 2008). Pour plus d’informations sur la configuration du comportement de l’analyse, voir Limiter ou augmenter la quantité de contenu analysé (Search Server 2008).
Types de référentiels de contenu
Vous pouvez analyser uniquement un seul genre de contenu par source de contenu. Autrement dit, vous pouvez créer une source de contenu qui contient des URL pour des sites SharePoint et une autre qui contient des URL pour des partages de fichiers, mais vous ne pouvez pas créer une seule source de contenu avec des URL pour des sites SharePoint et des partages de fichiers.
Le tableau suivant récapitule les genres de contenu que Serveur de recherche peut analyser et indexer :
Ce genre de source de contenu | Inclut ce genre de contenu |
---|---|
Sites SharePoint |
|
Sites Web |
|
Partages de fichiers |
|
Dossiers publics Exchange |
|
Lotus Notes |
|
Adresse de départ du contenu
Chaque source de contenu gère une liste d’adresses de départ que le robot utilise pour se connecter au référentiel de contenu. Chaque source de contenu peut contenir jusqu’à 500 adresses de départ. Vous ne pouvez pas analyser la même adresse avec plusieurs sources de contenu. Par exemple, si vous utilisez une source de contenu particulière pour analyser une collection de sites et tous ses sous-sites, vous ne pouvez pas utiliser une autre source de contenu pour analyser un de ces sous-sites selon une planification différente.
Analyse du contenu
Vous pouvez utiliser une source de contenu pour démarrer manuellement une analyse ou pour planifier le moment et la fréquence de l’analyse de la source de contenu. Pour analyser du contenu dans une partie de la source de contenu en utilisant une planification différente, vous devez créer une source de contenu distincte pour ce contenu. Pour des raisons de performance et de gérabilité, nous vous conseillons d’utiliser aussi peu de sources de contenu que possible. Pour plus d’informations sur le démarrage manuel ou la planification d’une analyse, voir Analyser du contenu (Search Server 2008).
Authentification
Lorsque le robot accède aux adresses de départ répertoriées dans une source de contenu, il doit être authentifié par les serveurs qui hébergent ce contenu et être autorisé à y accéder. Le compte d’utilisateur utilisé par le robot doit avoir au moins l’autorisation de lecture pour analyser le contenu. Par défaut, Serveur de recherche utilise le compte d’accès au contenu par défaut et NTLM pour l’authentification auprès des serveurs. Pour plus d’informations, voir Configurer l’authentification du robot (Search Server 2008).
Voir aussi
Concepts
Planification de l'analyse de contenu (Search Server 2008)
Configurer des recherches destinées à renvoyer des résultats de billets de blog (Search Server 2008)
Configurer des certificats clients pour l’analyse d’un site SSL (Search Server 2008)
Configurer les propriétés des composants WebPart (Search Server 2008)