Partager via


Comment analyser du contenu (Search Server 2008)

Mise à jour : 2009-04-16

Note Remarque :

Sauf indication contraire, les informations de cet article s'appliquent à Microsoft Search Server 2008 et à Microsoft Search Server 2008 Express.

Avant que les utilisateurs finaux puissent utiliser la fonctionnalité de recherche de contenu d’entreprise de Microsoft Search Server 2008 pour rechercher du contenu, vous devez d’abord analyser le contenu que vous souhaitez rendre disponible pour les requêtes des utilisateurs. Dans cet article, un contenu désigne un élément qui peut être analysé, tel qu’une page Web, un document Microsoft Office Word ou un site SharePoint.

Cet article décrit le processus de base nécessaire pour démarrer l’analyse de contenu et vous propose des liens vers des articles qui vous fournissent davantage d’informations et de procédures.

  1. Créer une source de contenu : une source de contenu définit le type de référentiel qui détient le contenu que vous voulez analyser, les adresses de départ à partir desquelles commencer l’analyse, le comportement à utiliser lors de l’analyse et la planification de l’analyse. Pour plus d’informations sur la création d’une source de contenu, voir À propos des sources de contenu (Search Server 2008) et Ajout d'une source de contenu pour analyser des sites SharePoint, des sites Web, des partages de fichiers ou des dossiers publics Microsoft Exchange Server (Search Server 2008).

  2. Spécifier les informations d’identification à utiliser pour analyser toutes les URL ou une plage spécifique d’URL : par défaut, le compte par défaut d’accès au contenu utilise les informations d’identification d’utilisateur de domaine Windows pour analyser les référentiels de contenu qui sont définis par les sources de contenu. Vous pouvez utiliser une règle d’analyse pour spécifier un accès différent au contenu qui peut être un certificat client, des informations d’identification de formulaires, un cookie ou un compte d’accès au contenu différentes. Pour des informations sur la configuration du compte par défaut d’accès au contenu, voir Changer le compte d’accès au contenu par défaut (Search Server 2008). Pour des informations sur l’utilisation d’une règle d’analyse, voir Utiliser des règles d’analyse pour déterminer le contenu à analyser (Search Server 2008).

  3. Configurer les paramètres de serveur proxy pour la recherche : lorsque vous analysez du contenu hébergé en dehors de votre réseau, vous configurez probablement un serveur proxy pour atteindre le serveur hôte. Dans ce cas, il est important de vérifier les paramètres du serveur proxy et de les configurer dans Search Server 2008. Pour cela, dans la page Administration de la recherche, sous Analyse, cliquez sur Proxy et délais. En règle générale, vous ne définissez cette option qu’une seule fois.

  4. Démarrer l’analyse complète : vous pouvez commencer par analyser de petites quantités de contenu définies dans une source de contenu particulière pour tester votre configuration de paramètres. Une fois que cela fonctionne pour une petite quantité de contenu, augmentez vos critères pour générer votre index. Pour savoir comment démarrer une analyse complète, voir Démarrer une analyse complète (Search Server 2008).

  5. Afficher le journal d’analyse : lors de l’analyse, nous vous recommandons de vérifier sa progression en consultant le journal d’analyse. Ainsi, vous pourrez vérifier si l’analyse fonctionne ou détecter les problèmes. Les problèmes courants sont l’échec d’autorisation ou l’inaccessibilité de l’ordinateur hôte. Lorsque vous détectez des problèmes dans le fichier journal, vous pouvez arrêter l’analyse, régler les paramètres sur les pages Gérer les sources de contenu, Gérer les règles d’analyse et Gérer les paramètres de recherche au niveau de la batterie, puis recommencer l’analyse. Si vous rencontrez des problèmes avec les emplacements fédérés, voir Réparer les emplacements fédérés (Search Server 2008).

Voir aussi

Concepts

Planification de l'analyse de contenu (Search Server 2008)
Opérations pour Search Server 2008