Freigeben über


Informationen zu Inhaltsquellen (Office SharePoint Server 2007)

Inhalte sind alle Elemente, die gecrawlt werden können, beispielsweise Webseiten, Microsoft Office Word-Dokumente, Geschäftsdaten oder E-Mail-Nachrichten. Inhalte befinden sich in einem Inhaltsrepository, beispielsweise einer Website, Dateifreigabe oder SharePoint-Website. Für eine Inhaltsquelle werden Einstellungen angegeben, durch die definiert wird, auf welche Weise und nach welchem Zeitplan Inhalte gecrawlt werden. Dazu gehört mindestens eine Adresse eines Inhaltsrepositorys, bei der das Crawlen beginnt. Diese Adresse wird auch als Startadresse bezeichnet. Diese Einstellungen gelten für alle Startadressen in der gesamten Inhaltsquelle.

Standardinhaltsquelle

Wenn in der Organisation nur die Inhalte von SharePoint-Websites gecrawlt werden sollen, müssen Sie möglicherweise keine zusätzliche Inhaltsquelle erstellen. In Microsoft Office SharePoint Server 2007 wird bei der anfänglichen Bereitstellung eine Standardinhaltsquelle definiert. Die Standardinhaltsquelle heißt Local Office SharePoint Server sites. Die Startadressen aller Webanwendungen in der Serverfarm sind automatisch in der Standardinhaltsquelle enthalten. Diese Inhaltsquelle wird standardmäßig nicht gecrawlt. Zum Indizieren der Inhalte in der Standardinhaltsquelle müssen Sie entsprechende Crawls manuell starten oder planen.

Erstellen einer neuen Inhaltsquelle

Beim Erstellen einer Inhaltsquelle geben Sie Einstellungen an, durch die definiert wird, welche Inhaltsarten gecrawlt werden und wann die Inhalte gecrawlt werden. Außerdem wird das Crawlverhalten definiert, beispielsweise die Tiefe des Crawlens innerhalb des Namespace der Startadresse oder die Anzahl der zulässigen Serverwechsel. Wenn Sie mehrere Arten von Inhaltsrepositorys crawlen möchten oder manche Inhaltsrepositorys mit unterschiedlichen Zeitplänen crawlen möchten, müssen Sie zusätzliche Inhaltsquellen erstellen. Von Microsoft Office SharePoint Server 2007 werden bis zu 500 Inhaltsquellen pro Anbieter für gemeinsame Dienste (Shared Service Provider, SSP) unterstützt, und jede Inhaltsquelle kann bis zu 500 Startadressen enthalten. Weitere Informationen zum Erstellen zusätzlicher Inhaltsquellen finden Sie im Abschnitt "Planen von Inhaltsquellen" in Planen des Crawlens von Inhalten (Office SharePoint Server). Weitere Informationen zum Konfigurieren des Crawlverhaltens finden Sie unter Begrenzen oder Erhöhen des Volumens der zu crawlenden Inhalte (Office SharePoint Server).

Arten von Inhaltsrepositorys

Sie können nur eine Art von Inhaltsrepository pro Inhaltsquelle crawlen. Das heißt, dass Sie eine Inhaltsquelle erstellen können, die URLs für SharePoint-Websites enthält, und eine weitere Quelle, die URLs für Dateifreigaben enthält. Sie können jedoch keine einzelne Inhaltsquelle erstellen, die URLs sowohl für SharePoint-Websites als auch für Dateifreigaben enthält.

In der folgenden Tabelle werden die Arten von Inhaltsrepositorys aufgelistet, die von Microsoft Office SharePoint Server 2007 gecrawlt werden können:

Diese Inhaltsquellenart Enthält diese Inhaltsart

SharePoint-Websites

  • SharePoint-Websites von der gleichen Farm oder von verschiedenen Microsoft Office SharePoint Server 2007-, Windows SharePoint Services 3.0- oder Microsoft Search Server 2008-Farmen

  • SharePoint-Websites von Microsoft Office SharePoint Portal Server 2003- oder Microsoft Windows SharePoint Services 2.0-Farmen

    Hinweis

    Mit dem Crawler von Microsoft Office SharePoint Server 2007 können automatisch alle Websites und Unterwebsites von Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 und Search Server 2008 gecrawlt werden. Zum Crawlen früherer Versionen der SharePoint-Produkte und -Technologien müssen Sie die URLs der einzelnen zu crawlenden Stammwebs (Websitesammlungen) und Unterwebsites angeben. Websites, die im Websiteverzeichnis von Microsoft Office SharePoint Portal Server 2003-Farmen aufgeführt sind, werden gecrawlt, wenn die Portalwebsite gecrawlt wird. Weitere Informationen zum Websiteverzeichnis finden Sie unter "Informationen zum Websiteverzeichnis" (in englischer Sprache) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x407)

Websites

  • Webinhalte in der Organisation, die auf SharePoint-Websites nicht gefunden werden.

  • Inhalte von Websites im Internet

    Hinweis

    Zwischen dem Verhalten des Crawlers bei Verwendung von Websiteinhalten und SharePoint-Websiteinhalten besteht kein Unterschied. Unterschiede bestehen nur zwischen den Crawleinstellungen, die Sie für diese Inhaltsquellenarten konfigurieren können.

Dateifreigaben

  • Inhalte in Dateifreigaben innerhalb der Organisation

Öffentliche Exchange-Ordner

  • Microsoft Exchange Server-Inhalte

Lotus Notes

Geschäftsdaten (nur Enterprise Edition)

  • In Branchenanwendungen gespeicherte Geschäftsdaten

    Sie können eine Inhaltsquelle zum Crawlen aller im Geschäftsdatenkatalog registrierten Anwendungen verwenden, oder Sie können separate Inhaltsquellen zum Crawlen einzelner im Geschäftsdatenkatalog registrierter Anwendungen erstellen.

    Vor dem Erstellen einer Inhaltsquelle für Geschäftsdaten müssen Sie die Anwendungen, in denen die Daten gehostet werden, im Geschäftsdatenkatalog registrieren. Weitere Informationen finden Sie unter Registrieren von Geschäftsanwendungen im Geschäftsdatenkatalog.

Startadresse der Inhalte

Jede Inhaltsquelle enthält eine Liste mit Startadressen, die vom Crawler zum Herstellen von Verbindungen mit dem Inhaltsrepository verwendet werden. Jede Inhaltsquelle kann bis zu 500 Startadressen enthalten. Sie können nicht die gleiche Adresse mithilfe mehrerer Inhaltsquellen crawlen. Wenn Sie beispielsweise eine bestimmte Inhaltsquelle zum Crawlen einer Websitesammlung und aller Unterwebsites verwenden, können Sie nicht eine andere Inhaltsquelle verwenden, um eine dieser Unterwebsites nach einem anderen Zeitplan zu crawlen.

Crawlen von Inhalten

Sie können eine Inhaltsquelle verwenden, um einen Crawl manuell zu starten oder um zu planen, wann und wie oft die ausgewählte Inhaltsquelle gecrawlt wird. Wenn Sie Inhalte in einem Teil der Inhaltsquelle nach einem anderen Zeitplan crawlen möchten, müssen Sie für diese Inhalte eine separate Inhaltsquelle erstellen. Im Hinblick auf die Leistung und die Verwaltung wird empfohlen, so wenige Inhaltsquellen wie möglich zu verwenden. Weitere Informationen zum manuellen Starten oder zum Planen eines Crawls finden Sie unter Crawlen von Inhalten (Office SharePoint Server 2007).

Authentifizierung

Wenn durch den Crawler auf die in einer Inhaltsquelle aufgelisteten Startadressen zugegriffen wird, muss der Crawler von den Servern, auf denen diese Inhalte gehostet werden, authentifiziert werden. Außerdem muss dem Crawler der Zugriff auf diese Server gewährt werden. Das vom Crawler verwendete Benutzerkonto muss zum Crawlen von Inhalten mindestens über die Leseberechtigung verfügen. Standardmäßig wird von Microsoft Office SharePoint Server 2007 das Standardkonto für den Inhaltszugriff verwendet, und für die Authentifizierung gegenüber Servern wird NTLM verwendet. Weitere Informationen finden Sie unter Konfigurieren der Crawlerauthentifizierung (Office SharePoint Server 2007).

Siehe auch

Konzepte

Planen des Crawlens von Inhalten (Office SharePoint Server)
Konfigurieren einer Suche zum Zurückgeben von Blogbeitragsergebnissen (Office SharePoint Server 2007)
Konfigurieren von Clientzertifikaten zum Crawlen einer SSL-Website(Office SharePoint Server 2007)