Verwenden von Crawlregeln zum Bestimmen der zu crawlenden Inhalte (Office SharePoint Server 2007)
Inhalt dieses Artikels:
Erstellen einer Crawlregel
Bearbeiten einer Crawlregel
Löschen einer Crawlregel
Neuanordnen von Crawlregeln
Bevor Sie diese Verfahren ausführen, sollten Sie Folgendes bestätigen:
- Sie haben das Thema Begrenzen oder Erhöhen des Volumens der zu crawlenden Inhalte (Office SharePoint Server) gelesen.
Wichtig
Sie müssen ein Administrator für gemeinsame Dienste sein, um die Verfahren in diesem Artikel auszuführen.
Sie können neue Crawlregeln erstellen oder vorhandene Crawlregeln bearbeiten, um festzulegen, welche Inhalte gecrawlt werden. Sie können die Crawlregeln auch neu anordnen, um festzulegen, in welcher Reihenfolge sie angewendet werden.
Erstellen einer Crawlregel
Verwenden Sie das folgende Verfahren, um eine Crawlregel zu erstellen.
Erstellen einer Crawlregel
Führen Sie je nach Status der Installation einen der folgenden Schritte aus.
Falls das Infrastrukturaktualisierung für Microsoft Office Server installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Suchverwaltung.
Klicken Sie auf der Seite Suchverwaltung auf der Schnellstartleiste im Abschnitt zum Crawlvorgang auf Crawlregeln.
Hinweis
Weitere Informationen finden Sie unter Hinweise zum Infrastrukturupdate für Microsoft Office Server vom 15.07.08 (https://go.microsoft.com/fwlink/?linkid=121886&clcid=0x407).
Falls das Infrastrukturaktualisierung für Microsoft Office Server nicht installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Sucheinstellungen.
Klicken Sie auf der Seite Sucheinstellungen konfigurieren im Abschnitt Crawleinstellungen auf Crawlregeln.
Klicken Sie auf der Seite Crawlregeln verwalten auf Neue Crawlregel.
Geben Sie auf der Seite Crawlregel hinzufügen im Abschnitt Pfad im Feld Pfad den von dieser Regel betroffenen Pfad ein. Für den Pfad können Sie Standardplatzhalterzeichen verwenden, zum Beispiel die Folgenden:
http://server1/ordner* schließt alle Webressourcen mit einer URL ein, die mit http://server1/ordner beginnt.
*://*.txt schließt alle Dokumente mit der TXT-Dateierweiterung ein.
Wählen Sie im Abschnitt Crawlkonfiguration eine der folgenden Optionen aus:
Alle Einträge in diesem Pfad ausschließen. Wählen Sie diese Option aus, wenn alle Elemente im angegebenen Pfad von dem Crawlvorgang ausgeschlossen werden sollen.
Alle Einträge in diesem Pfad einschließen. Wählen Sie diese Option aus, wenn alle im Pfad enthaltenen Elemente gecrawlt werden sollen.
Wenn Sie festlegen, dass alle Elemente in diesem Pfad ausgeschlossen werden sollen, setzen Sie den Vorgang mit Schritt 7 fort. Andernfalls können Sie die Einschlüsse durch eine Kombination der folgenden Optionen genauer definieren:
Hyperlinks für die URL folgen, ohne die URL selbst zu crawlen. Wählen Sie diese Option aus, wenn in der URL enthaltene Links gecrawlt werden sollen, nicht aber die URL selbst.
Komplexe URLs (URLs mit Fragezeichen (?)) crawlen. Wählen Sie diese Option aus, wenn URLs mit Parametern in der Schreibweise mit Fragezeichen (?) gecrawlt werden sollen.
SharePoint-Inhalt als HTTP-Seiten crawlen. Normalerweise wird zum Crawlen von SharePoint-Inhalten ein spezielles Protokoll verwendet. Wählen Sie diese Option aus, wenn SharePoint-Inhalte stattdessen als HTTP-Seiten gecrawlt werden sollen. Wenn Inhalte mit HTTP gecrawlt werden, werden keine Elementberechtigungen gespeichert. Das heißt, dass alle Elemente, die einer bestimmten Suchabfrage entsprechen, auf den Suchergebnisseiten angezeigt werden, unabhängig davon, ob der Benutzer, der die Abfrage gestartet hat, auf diese Elemente Zugriff hat.
Zweck dieser Einstellung ist es, den Suchadministratoren die Möglichkeit zu geben, Remote-SharePoint-Websites zu crawlen, über die sie keine explizite Kontrolle haben und bei denen sie daher auch nicht durchsetzen können, dass das zum Crawlen der Remotewebsites verwendete Domänenkonto volle Leseberechtigungen für die Websites erhalten hat.
Hinweis
Informationen zu den Einstellungen im Abschnitt Authentifizierung angeben finden Sie unter Verwenden von Crawlregeln zum Angeben eines anderen Inhaltszugriffskontos oder einer anderen Authentifizierungsmethode (Office SharePoint Server 2007).
Klicken Sie auf OK.
Wiederholen Sie die Schritte 4 bis 7 für jede neue Crawlregel, die erstellt werden soll.
Bearbeiten einer Crawlregel
Sie können eine vorhandene Crawlregel jederzeit bearbeiten, indem Sie darauf klicken und entsprechend der Beschreibung im vorherigen Verfahren die erforderlichen Änderungen am Pfad und an der Konfiguration vornehmen.
Hinweis
Dafür ist ein vollständiger Crawlvorgang für den Inhalt erforderlich, der von der geänderten Crawlregel betroffen ist.
Löschen einer Crawlregel
Verwenden Sie das folgende Verfahren, um eine nicht mehr benötigte Crawlregel zu löschen.
Löschen einer Crawlregel
Führen Sie je nach Status der Installation einen der folgenden Schritte aus.
Falls das Infrastrukturaktualisierung für Microsoft Office Server installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Suchverwaltung.
Klicken Sie auf der Seite Suchverwaltung auf der Schnellstartleiste im Abschnitt zum Crawlvorgang auf Crawlregeln.
Hinweis
Weitere Informationen finden Sie unter Hinweise zum Infrastrukturupdate für Microsoft Office Server vom 15.07.08 (https://go.microsoft.com/fwlink/?linkid=121886&clcid=0x407).
Falls das Infrastrukturaktualisierung für Microsoft Office Server nicht installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Sucheinstellungen.
Klicken Sie auf der Seite Sucheinstellungen konfigurieren im Abschnitt Crawleinstellungen auf Crawlregeln.
Zeigen Sie auf der Seite Crawlregeln verwalten auf die zu löschende Crawlregel, klicken Sie auf den angezeigten Pfeil, und klicken Sie dann im angezeigten Menü auf Löschen.
Klicken Sie auf OK, um den Löschvorgang zu bestätigen.
Hinweis
Dafür ist ein vollständiger Crawlvorgang für den Inhalt erforderlich, der von der gelöschten Crawlregel betroffen ist.
Neuanordnen von Crawlregeln
Nachdem Sie neue Crawlregeln erstellt haben, empfiehlt es sich, die Reihenfolge anzugeben, in der die Regeln beim Crawlen des Inhalts angewendet werden sollen. Crawlregeln werden in der Reihenfolge angewendet, in der sie in der Liste aufgeführt sind. Daher wird bei zwei Regeln, die denselben oder sich überschneidenden Inhalt abdecken, die in der Liste zuerst aufgeführte Regel angewendet. Gehen Sie zum Angeben der Reihenfolge der Crawlregeln wie folgt vor.
Neuanordnen von Crawlregeln
Führen Sie je nach Status der Installation einen der folgenden Schritte aus.
Falls das Infrastrukturaktualisierung für Microsoft Office Server installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Suchverwaltung.
Klicken Sie auf der Seite Suchverwaltung auf der Schnellstartleiste im Abschnitt zum Crawlvorgang auf Crawlregeln.
Hinweis
Weitere Informationen finden Sie unter Hinweise zum Infrastrukturupdate für Microsoft Office Server vom 15.07.08 (https://go.microsoft.com/fwlink/?linkid=121886&clcid=0x407).
Falls das Infrastrukturaktualisierung für Microsoft Office Server nicht installiert ist, klicken Sie in der Zentraladministration auf der Schnellstartleiste in der Gruppe Verwaltung der gemeinsamen Dienste auf einen gemeinsamen Dienst.
Klicken Sie auf der Seite Verwaltung der gemeinsamen Dienste im Abschnitt Suchen auf Sucheinstellungen.
Klicken Sie auf der Seite Sucheinstellungen konfigurieren im Abschnitt Crawleinstellungen auf Crawlregeln.
Wählen Sie auf der Seite Crawlregeln verwalten in der Liste der Crawlregeln in der Spalte Reihenfolge einen Wert aus, um die gewünschte Position der Regel anzugeben. Andere Werte werden entsprechend verschoben.
Sie können auch eine globale Ausschlussregel verwenden, die unabhängig von der Reihenfolge ihrer Auflistung gilt. Weitere Informationen zur Verwaltung von Crawlregeln finden Sie im Abschnitt "Verwalten von Crawlregeln" in der folgenden Ressource: Book Excerpt - Chapter 16 Enterprise search and indexing architecture and administration (in englischer Sprache).
Hinweis
Dafür ist ein vollständiger Crawlvorgang für den Inhalt erforderlich, der von der neu angeordneten Crawlregel betroffen ist.