Planen von Durchforstung und Verbund in SharePoint Server
GILT FÜR:2013 2016 2019 Subscription Edition SharePoint in Microsoft 365
Bevor Benutzer Suchvorgänge in SharePoint Server ausführen können, müssen Sie den Inhalt durchforsten oder einen Verbund erstellen, den sie durchsuchen können sollen. Wenn Sie Inhalte durchforsten, erstellt der Suchdienst einen Suchindex, für den Benutzer Abfragen (Suchanforderungen) ausführen können. Sie können das Suchsystem auch so konfigurieren, dass Suchergebnisse eines externen Anbieters (z. B. Bing) zusammen mit den Ergebnissen des lokal erstellten Indexes angezeigt werden. Dieses Verfahren zum Abrufen von Suchergebnissen von einem externen Anbieter und lokalen Anzeigen von Ergebnissen wird als Verbund bezeichnet.
Planen von Inhaltsquellen
Bei einer Inhaltsquelle handelt es sich um eine Definition von Durchforstungseinstellungen. Sie legen etwa fest, welche Hosts und welche Inhaltstypen durchforstet werden (wie SharePoint-Inhalte oder -Dateifreigaben), die Tiefe der Durchforstung sowie einen Durchforstungsplan.
Wenn Sie eine Suchdienstanwendung erstellen, stellt die Dienstanwendung automatisch die vorkonfigurierte Inhaltsquelle Lokale SharePoint-Websites bereit. Mithilfe dieser Inhaltsquelle können Sie angeben, wie alle SharePoint-Inhalte in Webanwendungen der Suchdienstanwendung zugeordnet werden.
Wenn Sie nur einen Inhaltstyp verwenden (wenn z. B. der gesamte Inhalt vom Typ SharePoint-Websites oder -Dateifreigaben ist), benötigen Sie möglicherweise nur eine Inhaltsquelle. Wenn Sie jedoch mehrere verschiedene Inhaltstypen oder individuelle Anforderungen pro Host haben, sollten Sie mehrere Inhaltsquellen definieren. Planen Sie, zusätzliche Inhaltsquellen zu erstellen, wenn Sie die folgenden Aufgaben ausführen müssen:
Durchforsten unterschiedlicher Inhaltstypen – z. B. Dateifreigaben und Daten in Geschäftsanwendungen
Durchforsten bestimmter Inhalte mit Zeitplänen, die sich von denen anderer Inhalte unterscheiden
Begrenzen oder Erhöhen des Volumens der zu durchforstenden Inhalte
Festlegen verschiedener Prioritäten für das Durchforsten unterschiedlicher Websites
Häufigeres Aktualisieren einiger Inhaltstypen im Vergleich zu den restlichen
Sie können für jede Suchdienstanwendung eine große Anzahl von Inhaltsquellen erstellen, doch jede Inhaltsquelle bedeutet Mehraufwand. Aus diesem Grund sollten Sie so wenige Inhaltsquellen wie möglich erstellen, die Ihre weiteren betrieblichen Anforderungen erfüllen wie Unterschiede in der Priorität und Planung für die Durchforstung. Jede Inhaltsquelle kann bis zu 100 Startadressen enthalten.
Planen des Durchforstens von unterschiedlichen Inhaltstypen
Sie können nur eine Art von Inhalt pro Inhaltsquelle durchforsten. Sie können beispielsweise eine Inhaltsquelle erstellen, die Startadressen für SharePoint-Websites enthält, und eine andere Inhaltsquelle, die Startadressen für Dateifreigaben enthält, aber Sie können keine einzelne Inhaltsquelle erstellen, die Startadressen sowohl für SharePoint-Websites als auch für Dateifreigaben enthält. Im Folgenden eine Tabelle der Typen von Inhaltsquellen, die Sie konfigurieren können.
**Verwenden Sie diese Art von Inhaltsquelle. | ... für diesen Inhalt |
---|---|
SharePoint-Websites | SharePoint-Websites von derselben Farm oder verschiedenen SharePoint Server- Farmen. SharePoint-Websites aus derselben Farm oder anderen SharePoint Server 2019-, SharePoint Server 2016-, SharePoint Server 2013-, SharePoint Server 2010-, SharePoint Foundation 2010- oder Microsoft Search Server 2010-Farmen. SharePoint-Websites von derselben Farm oder verschiedenen Office SharePoint Server 2007-, Windows SharePoint Services 3,0- oder Search Server 2008-Farmen. |
Websites | Andere Webinhalte in Ihrer Organisation, die sich nicht auf SharePoint-Websites befinden Inhalte von Websites im Internet |
Dateifreigaben | Inhalte in Dateifreigaben innerhalb der Organisation Sicherheitshinweis: Wenn der Suchdienst eine Dateifreigabe durchforstet und sich die Berechtigungen für eine Datei in der Freigabe von den Berechtigungen für Ordner unterscheiden, welche die Datei enthalten, haben die Berechtigungen für die Datei Vorrang und werden für Einschränkungen von Suchergebnissen verwendet. Um sicherzustellen, dass nur geeignete Elemente in den Suchergebnissen angezeigt werden, sollten Sie deshalb darauf achten, dass Dateien auf Dateifreigaben angemessene Berechtigungen aufweisen. In Fällen, in denen Dateiberechtigungen nicht angemessen sind, können Sie bestimmte Elemente aus dem Suchindex oder den Suchergebnissen löschen. Weitere Informationen finden Sie unter Delete items from the search index or from search results in SharePoint Server. |
Öffentliche Exchange-Ordner | Öffentliche Exchange 2007- und Exchange Server 2010-Ordner. |
Lotus Notes | In Lotus Notes-Datenbanken gespeicherte E-Mail-Nachrichten Hinweis: Im Gegensatz zu allen anderen Typen von Inhaltsquellen wird die Option für Lotus Notes-Inhaltsquellen erst auf der Benutzeroberfläche angezeigt, wenn Sie die entsprechende erforderliche Software installiert und konfiguriert haben. Weitere Informationen finden Sie unter Configure and use the Lotus Notes connector for SharePoint Server (gilt auch für SharePoint Server). |
Documentum | Inhalt aus dem EMC Documentum-System Anmerkung: Sie können EMC Documentum-Inhalte nicht durchforsten, bevor Sie die entsprechende erforderliche Software und den Microsoft SharePoint Indexing Connector für Documentum installiert und konfiguriert haben. Weitere Informationen finden Sie unter Configure and use the Documentum connector in SharePoint Server (gilt auch für SharePoint Server). |
Branchendaten | In Branchenanwendungen gespeicherte Geschäftsdaten |
Benutzerdefiniertes Repository | Inhaltsquellen, die erst nach der Installation und Registrierung eines benutzerdefinierten Konnektor durchforstet werden können |
Inhaltsquellen für Branchendaten
Bei Inhaltsquellen für Branchendaten müssen die Anwendungen, die die Daten hosten, in einem Anwendungsmodell einer Business Data Connectivity-Dienstanwendung angegeben werden. Sie können eine einzelne Inhaltsquelle erstellen, um alle im Business Data Connectivity-Dienst registrierten Anwendungen zu durchforsten, oder aber getrennte Inhaltsquellen zum Durchforsten einzelner Anwendungen erstellen. Weitere Informationen finden Sie im Artikel zum Konnektorframework der Suche in SharePoint 2013 (Dieser MSDN-Artikel gilt auch für SharePoint Server).
Häufig wird die Integration von Geschäftsdaten in Websitesammlungen von anderen Personen geplant als denen, die am allgemeinen Inhaltsplanungsprozess beteiligt sind. Daher sollten an den Inhaltsplanungsteams Administratoren für Geschäftsanwendungen beteiligt werden, um die Integration der Geschäftsanwendungsdaten in Inhalte und deren effektive Darstellung in den Websitesammlungen anzuleiten.
Durchforsten von Inhalten mit unterschiedlichen Zeitplänen
Erwägen Sie aus folgenden Gründen, Inhaltsquellen mit unterschiedlichen Zeitplänen zu definieren:
Berücksichtigung von Ausfallzeiten und Spitzenauslastungszeiten
Häufigeres Durchforsten von Inhalten, die häufiger aktualisiert werden
Separates Durchforsten von Inhalten, die jeweils auf langsameren bzw. schnelleren Servern gespeichert sind
Um eine SharePoint-Inhaltsquelle laufend zu durchforsten, um hohe Aktualitätsanforderungen zu erfüllen. Weitere Informationen finden Sie unter Manage continuous crawls in SharePoint Server.
Gründe für eine vollständige Durchforstung
Folgende Gründe sprechen für eine vollständige Durchforstung von einer oder mehreren Inhaltsquellen durch den Administrator einer Suchdienstanwendung:
Eine Suchdienstanwendung wurde soeben erstellt, und die vorkonfigurierte Inhaltsquelle Lokale SharePoint-Websites wurde noch nicht durchforstet.
Eine andere Inhaltsquelle ist neu und wurde noch nicht durchforstet.
Der Suchdienstanwendungs-Administrator hat eine Inhaltsquelle geändert.
Ein Softwareupdate oder Service Pack wurde auf Servern in der Farm installiert. Weitere Informationen finden Sie in den Anleitungen zu dem betreffenden Softwareupdate oder Service Pack.
Ein Suchdienstanwendungs-Administrator Websitesammlungs-Administrator hat eine neue verwaltete Eigenschaft hinzugefügt oder geändert. Damit die neue oder geänderte verwaltete Eigenschaft wirksam wird, ist eine vollständige Durchforstung aller durchforsteten Inhaltsquellen erforderlich.
Sie möchten Sicherheitsänderungen ermitteln, die seit der letzten vollständigen Durchforstung einer Dateifreigabe an deren lokalen Gruppen vorgenommen wurden.
Sie möchten Fehler bei inkrementellen Durchforstungen beheben, die mehrmals nacheinander aufgetreten sind. Wenn bei einem bestimmten Inhalt mehrmals nacheinander Fehler auftreten, entfernt das System den betroffenen Inhalt aus dem Suchindex.
Durchforstungsregeln wurden hinzugefügt, gelöscht oder geändert.
Sie möchten einen beschädigten Suchindex ersetzen.
Die Berechtigungen für das Benutzerkonto, das dem Standardkonto für den Inhaltszugriff zugeordnet ist, wurden geändert.
Das System führt unter folgenden Umständen auch dann eine vollständige Durchforstung aus, wenn eine inkrementelle oder kontinuierliche Durchforstung geplant ist:
Die vorherige Durchforstung wurde von einem Suchadministrator gestoppt.
Eine Inhaltsdatenbank wurde wiederhergestellt oder ein Farmadministrator hat eine Inhaltsdatenbank getrennt und erneut angefügt.
Von dieser Suchdienstanwendung wurde noch nie eine vollständige Durchforstung ausgeführt.
Die Durchforstungsdatenbank enthält keine Einträge für die zu durchforstenden Adressen. Wenn in der Durchforstungsdatenbank für die zu durchforstenden Elemente keine Einträge vorhanden sind, können keine inkrementellen Durchforstungen ausgeführt werden.
Einschränken oder Erhöhen der Menge der durchforsteten Inhalte
Die in den Eigenschaften für jede Inhaltsquelle verfügbaren Optionen hängen vom ausgewählten Inhaltsquellentyp ab. Mit den Optionen für die Durchforstungseinstellungen können Sie den Umfang des durchforsteten Inhalts einschränken oder erhöhen. Für jede Inhaltsquelle können Sie angeben, wie umfassend die Startadressen durchforstet werden sollen. Für die meisten Typen von Inhaltsquellen können Sie angeben, wie viele Ebenen tief von jeder Startadresse aus die Inhalte durchforstet werden sollen. Dieses Verhalten wird auf alle Startadressen in einer bestimmten Inhaltsquelle angewendet. Wenn Sie einige Websites auf tieferen Ebenen durchforsten möchten, können Sie zusätzliche Inhaltsquellen erstellen, die diese Websites umfassen. In der folgenden Tabelle werden bewährte Methoden zum Konfigurieren der Optionen für Durchforstungseinstellungen beschrieben.
Vorgesehene Inhaltsquelle | Situation | Geeignete Option für die Durchforstungseinstellungen |
---|---|---|
SharePoint-Websites | Sie möchten die Inhalte auf der Website selbst einschließen, aber nicht die Inhalte auf den Unterwebsites, oder Sie möchten die Inhalte auf Unterwebsites nach einem anderen Zeitplan durchforsten. | Nur die SharePoint-Website für jede Startadresse durchforsten. |
SharePoint-Websites | Sie möchten die Inhalte auf der Website selbst einschließen. - oder - Sie möchten sämtliche Inhalte unter der Startadresse mit demselben Zeitplan durchforsten. |
Alle Websites unter dem Hostnamen für jede Startadresse durchforsten. |
Websites | Die auf verknüpften Websites verfügbaren Inhalte sind wahrscheinlich nicht relevant. | Nur innerhalb des Servers jeder Startadresse durchforsten. |
Websites | Relevante Inhalte befinden sich nur auf der ersten Seite. | Nur die erste Seite jeder Startadresse durchforsten. |
Websites | Sie möchten die Tiefe beschränken, mit der die Links der Startadressen durchforstet werden. | Benutzerdefiniert - Geben Sie die Seitentiefe und die Serverwechsel an. Hinweis: Bei stark vernetzten Websites wird empfohlen, mit einer kleinen Anzahl zu beginnen, da möglicherweise das gesamte Internet durchforstet wird, wenn eine Tiefe von mehr als drei Seiten angegeben wird oder mehr als drei Serverwechsel angegeben werden. |
Dateifreigaben Öffentliche Exchange-Ordner |
Die in den Unterordnern verfügbaren Inhalte sind wahrscheinlich nicht relevant. | Nur den Ordner jeder Startadresse durchforsten. |
Dateifreigaben Öffentliche Exchange-Ordner |
Die Inhalte in den Unterordnern sind wahrscheinlich relevant. | Den Ordner und alle Unterordner jeder Startadresse durchforsten. |
Geschäftsdaten | Alle im BDC (Business Data Catalog)-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte. | Den gesamten Business Data Catalog-Metadatenspeicher durchsuchen. |
Geschäftsdaten | Alle im BDC-Metadatenspeicher registrierten Anwendungen enthalten relevante Inhalte. - oder - Sie möchten einige Anwendungen mit einem anderen Zeitplan durchforsten. |
Ausgewählte Anwendungen durchforsten. |
Planen von Konnektoren
Ein Crawler verwendet Konnektoren (in früheren Versionen von SharePoint Server) als "Protokollhandler" bezeichnet), um Inhalte abzurufen und zu indizieren. SharePoint Server stellt Konnektoren für die gängigsten Protokolle zur Verfügung und verwendet die entsprechenden Konnektoren. Wenn Sie jedoch Inhalte durchforsten möchten, für die ein nicht standardmäßig bereitgestellter Konnektor erforderlich ist, müssen Sie zuerst einen Konnektor von einem Drittanbieter installieren oder einen benutzerdefinierten Konnektor erstellen. Eine Liste der standardmäßig installierten Konnektoren finden Sie unter Default connectors in SharePoint Server (gilt auch für SharePoint Server).
Weitere Überlegungen beim Planen von Inhaltsquellen
Bei Inhaltsrepositorys des gleichen Typs, wie z. B. SharePoint-Websites, hängt die Entscheidung, ob eine oder mehrere Inhaltsquellen verwendet werden, weitgehend von Verwaltungsüberlegungen ab. Organisieren Sie zum Vereinfachen der Verwaltung die Inhaltsquellen so, dass Aktualisierungen von Inhaltsquellen, Durchforstungsregeln und Durchforstungszeitplänen für die Administratoren unkompliziert sind.
Sie können Startadressen nicht in mehreren Inhaltsquellen in derselben Suchdienstanwendung durchforsten. Wenn Sie beispielsweise eine bestimmte Inhaltsquelle verwenden, um eine Websitesammlung und alle dazugehörigen Unterwebsites zu durchforsten, können Sie keine andere Inhaltsquelle verwenden, um eine dieser Unterwebsites separat mit einem anderen Zeitplan zu durchforsten.
Administratoren aktualisieren Inhaltsquellen häufig. Wird eine Inhaltsquelle geändert, ist eine vollständige Durchforstung für diese Inhaltsquelle erforderlich. Erwägen Sie daher, separate Inhaltsquellen zu erstellen, damit Sie bei Bedarf mehrere vollständige Durchforstungen gleichzeitig durchführen können und eine vollständige Durchforstung für eine Inhaltsquelle weniger Zeit beansprucht.
Planen von Durchforstungsregeln zum Optimieren von Durchforstungen
Durchforstungsregeln gelten für alle Inhaltsquellen in der Suchdienstanwendung. Sie können Durchforstungsregeln auf eine bestimmte URL oder auf eine Gruppe von URLs anwenden, um folgende Aktionen auszuführen:
Vermeiden des Durchforstens irrelevanten Inhalts, indem eine oder mehrere URLs ausgeschlossen werden. Dadurch werden auch die Verwendung von Serverressourcen und der Netzwerkverkehr reduziert.
Durchforsten von Hyperlinks in der URL, ohne die URL selbst zu durchforsten. Diese Option ist bei Websites nützlich, die Hyperlinks mit relevantem Inhalt enthalten, wenn die ursprüngliche Seite mit den Hyperlinks keine relevanten Informationen enthält.
Aktivieren des Durchforstens komplexer URLs. Mit dieser Option werden URLs durchforstet, die einen Abfrageparameter mit einem Fragezeichen enthalten. Je nach Website können sich diese URLs auf relevante Inhalte beziehen. Da komplexe URLs häufig auf irrelevante Websites umleiten, empfiehlt es sich, diese Option nur für Websites zu aktivieren, für die der Inhalt von komplexen URLs als relevant bekannt ist.
Aktivieren des Durchforstens von Inhalt auf SharePoint-Websites als HTTP-Seiten. Diese Option ermöglicht dem Suchsystem, SharePoint-Websites hinter einer Firewall oder in Szenarien zu durchforsten, bei denen die durchforstete Website den Zugriff auf den vom Crawler verwendeten Webdienst beschränkt (eine Durchforstungskomponente in der Suchtopologie).
Angeben, ob das Standardkonto für den Inhaltszugriff, ein anderes Konto für den Inhaltszugriff oder ein Clientzertifikat zum Durchforsten der angegebenen URL verwendet werden soll.
Da das Durchforsten von Inhalt Ressourcen und Bandbreite verbraucht, empfiehlt es sich, eine kleinere Menge an Inhalt einzuschließen, dessen Relevanz Ihnen bekannt ist, statt einer größeren Menge an Inhalt, der möglicherweise irrelevant ist. Nach der anfänglichen Bereitstellung können Sie die Abfrage und die Durchforstungsprotokolle überprüfen sowie Inhaltsquellen und Durchforstungsregeln so anpassen, dass deren Relevanz erhöht wird und weiterer Inhalt eingeschlossen wird.
Planen der Crawlerauthentifizierung
Wenn der Crawler auf die in den Inhaltsquellen aufgelisteten Startadressen zugreift, muss er von den Servern, auf denen der Inhalt gehostet wird, authentifiziert werden und Zugriff auf diese Server erhalten. Standardmäßig wird das Standardkonto für den Inhaltszugriff verwendet. Sie können auch Durchforstungsregeln verwenden, um ein anderes Konto für den Inhaltszugriff anzugeben, das beim Durchforsten von bestimmten Inhalten verwendet werden soll. Unabhängig davon, ob Sie das Standardkonto für den Inhaltszugriff oder ein anderes, durch eine Durchforstungsregel angegebenes Konto für den Inhaltszugriff verwenden, muss das verwendete Inhaltszugriffskonto zumindest über die Leseberechtigung für alle durchforsteten Inhalte verfügen. Andernfalls wird der Inhalt nicht durchforstet und nicht indiziert und ist deshalb für Abfragen nicht verfügbar.
Das Konto, das Sie als Standardkonto für den Inhaltszugriff angeben, sollte Zugriff auf den Großteil der durchforsteten Inhalte haben. Verwenden Sie andere Inhaltszugriffskonten nur dann, wenn Sicherheitsüberlegungen separate Inhaltszugriffskonten erforderlich machen.
Bestimmen Sie für jede geplante Inhaltsquelle die Startadressen, auf die nicht mit dem Standardkonto für den Inhaltszugriff zugegriffen werden kann, und planen Sie dann das Hinzufügen von Durchforstungsregeln für diese Startadressen.
Wichtig
Achten Sie darauf, dass das Domänenkonto, das für das Standardkonto für den Inhaltszugriff oder ein anderes Konto für den Inhaltszugriff verwendet wird, nicht das gleiche Domänenkonto ist, das auch von einem Anwendungspool verwendet wird, der einer zu durchforstenden Webanwendung zugeordnet ist. Wird das gleiche Domänenkonto verwendet, kann dies zur Folge haben, dass unveröffentlichte Inhalte auf SharePoint-Websites und Nebenversionen von Dateien (d. h. veraltete Versionen) auf SharePoint-Websites durchforstet und indiziert werden.
Ein weiterer wichtiger Aspekt ist, dass der Crawler dasselbe Authentifizierungsprotokoll wie der Hostserver verwenden muss. Standardmäßig verwendet der Crawler zur Authentifizierung NTLM. Sie können für den Crawler bei Bedarf die Verwendung eines anderen Authentifizierungsprotokolls konfigurieren.
Stellen Sie bei Verwendung der anspruchsbasierten Authentifizierung sicher, dass für jede zu durchforstende Webanwendung die Windows-Authentifizierung aktiviert ist.
Planen der Inhaltsverarbeitung
Der Crawler durchforstet Inhaltsrepositorys, die von Inhaltsquellen angegeben werden, und führt dann die Inhalte und Metadaten durchforsteter Elemente der Inhaltsverarbeitungskomponente zu. Die Inhaltsverarbeitungskomponente liest und analysiert die durchforsteten Elemente und berichtet die Eigenschaften dann an die Suchverwaltungsdatenbank.
Sie können durchforstete Eigenschaften verwalteten Eigenschaften zuordnen und durch Bearbeiten des Suchschemas Eigenschaftseinstellungen konfigurieren. Die Inhaltsverarbeitungskomponente liest dieses Suchschema und verwendet es zum Ausführen der Zuordnung. Der Suchindex enthält nur verwaltete Eigenschaften. Verwaltete Eigenschaften können beispielsweise zum Erstellen von Einschränkungen verwendet werden. Weitere Informationen finden Sie unter Übersicht über das Suchschema in SharePoint Server.
Ein- oder Ausschließen von Dateitypen
In den Suchindex können Inhalte aus beliebigen Dateitypen einbezogen werden. Um Inhalte zu indizieren, müssen diese zuerst von einer Durchforstungskomponente durchforstet und dann von einer Inhaltsverarbeitungskomponente analysiert werden. Eine Durchforstungskomponente kann Dateien nur durchforsten, wenn die Dateierweiterung in der Liste der Dateinamenerweiterungen auf der Seite "Dateitypen verwalten" aufgeführt ist. Eine Inhaltsverarbeitungskomponente kann den Inhalt durchforsteter Dateien nur unter den folgenden Bedingungen analysieren:
Die Inhaltsverarbeitungskomponente verfügt über einen Formathandler, der das Dateiformat analysieren kann.
Die Inhaltsverarbeitungskomponente ist aktiviert, um Dateien mit dem betreffenden Dateiformat und der betreffenden Dateinamenerweiterung zu analysieren.
Wenn die Inhaltsverarbeitungskomponente eine Datei nicht analysieren kann, enthält der Suchindex nur Dateieigenschaften, z. B. den Dateinamen.
Standardmäßig erfüllt SharePoint Server diese Anforderungen für zahlreiche Dateitypen und kann diese daher durchforsten und analysieren, ohne dass Sie zusätzliche Formathandler installieren müssen. Eine Übersicht über die Dateitypen finden Sie unter Default crawled file name extensions and parsed file types in SharePoint Server.
Hinweis
[!HINWEIS] Sie können die Liste der Dateiformate, die SharePoint Server standardmäßig analysieren kann, erweitern, indem Sie als iFormats bezeichnete filterbasierte Formathandler von Drittanbietern hinzufügen. Ein Drittanbieter-iFilter kann integrierte Formathandler überschreiben.
Wenn Sie in den Suchindex Inhalte aus Inhaltsrepositorys mit Dateitypen einbeziehen möchten, die nicht auf der Seite Dateitypen verwalten aufgeführt sind, beachten Sie Folgendes:
Fügen Sie den Dateityp der Seite "Dateitypen verwalten" hinzu, um ihn durchforsten zu können.
So analysieren Sie den Dateityp:
Wenn SharePoint Server für das Format keinen Formathandler aufweist, installieren Sie auf jedem Server, der eine Inhaltsverarbeitungskomponente in der Suchdienstanwendung hostet, einen filterbasierten Drittanbieter-Formathandler für das Dateiformat.
Aktivieren Sie auf jedem Server, der eine Inhaltsverarbeitungskomponente in der Suchdienstanwendung hostet, die Analyse des Dateiformats und der Dateinamenerweiterung.
Weitere Informationen finden Sie unter Add or remove a file type from the search index in SharePoint Server.
Planen der Verwendung von (benutzerdefinierten) Ausdrucksextraktionen
Sie können das Suchsystem so konfigurieren, dass unstrukturierter Inhalt nach "Entitäten" durchsucht wird, z. B. der Textkörper oder der Titel eines Dokuments. Bei diesen Entitäten kann es sich um Wörter oder Phrasen wie z. B. Produktnamen handeln. Sie können eigene Wörterbücher erstellen und bereitstellen, um anzugeben, nach welchen Entitäten gesucht werden soll.
Die extrahierten Entitäten werden im Suchindex als separate verwaltete Eigenschaften gespeichert, die automatisch so konfiguriert sind, dass sie auffindbar, durchsuchbar, abrufbar, sortierbar und einschränkbar sind. Sie können diese Eigenschaften z. B. in Sucheinschränkungen verwenden, um Benutzer beim Filtern ihrer Suchergebnisse zu unterstützen.
Als Unternehmen können Sie das bereits ausgefüllte, von SharePoint Server bereitgestellte Unternehmensextraktionswörterbuch verwenden.
Zudem können Sie mehrere Typen benutzerdefinierter Entitätsextraktionsfunktionen in Form von benutzerdefinierten Entitätsextraktionswörterbüchern bereitstellen. Diese Wörterbücher stellen Sie mithilfe von Microsoft PowerShell bereit. Die Einträge in diesen Wörterbüchern (einzelne oder mehrere Wörter) werden mit Wörtern oder Wortteilen im Inhalt abgeglichen, wobei die Groß-/Kleinschreibung entweder beachtet oder ignoriert wird. Weitere Informationen finden Sie unter Erstellen und Bereitstellen von benutzerdefinierten Entitätsextraktionsfunktionen in SharePoint Server.
Benutzerdefinierte Entitätsextraktionsfunktion/benutzerdefiniertes Wörterbuch | Beschreibung |
---|---|
Wortextraktion | Ohne Berücksichtigung der Groß-/Kleinschreibung, maximal fünf Wörterbücher. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "Anchor", nicht jedoch "anchorage". |
Wortteilextraktion | Ohne Berücksichtigung der Groß-/Kleinschreibung, maximal fünf Wörterbücher. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "Anchor" und "anchorage". |
Exakte Wortextraktion | Berücksichtigung der Groß-/Kleinschreibung, maximal ein Wörterbuch. Die Eingabe "anchor" erzielt z. B. den Treffer "anchor", nicht jedoch "Anchor" oder "Anchorage". |
Exakte Wortteilextraktion | Berücksichtigung der Groß-/Kleinschreibung, maximal ein Wörterbuch. Die Eingabe "anchor" erzielt z. B. die Treffer "anchor" und "anchorage", nicht jedoch "Anchor". |
Informationen zu Ergebnisquellen und Verbund
In SharePoint Server verwenden Sie eine Ergebnisquelle zum Angeben der URL eines Anbieters, von dem Suchergebnisse abgerufen werden sollen, ein Protokoll zum Abrufen dieser Ergebnisse und andere verwandte Einstellungen. Die vorkonfigurierte Standardergebnisquelle heißt beispielsweise Lokale SharePoint-Ergebnisse.
Sie können Ergebnisquellen hinzufügen, die externe Suchanbieter angeben (wie Remotesuchmaschinen oder Feeds), von denen Suchergebnisse abgerufen werden. Dies wird als Verbund bezeichnet.
Informationen zum Verbund
Beim Arbeiten mit einem Verbund können Benutzer Inhalte suchen und abrufen, die nicht von Servern in der lokalen Farm durchforstet wurden. Der Verbund kann z. B. Suchergebnisse eines Internetsuchanbieters wie Bing oder aus einer privaten Datenmenge bereitstellen, auf die Sie keinen Durchforstungszugriff haben.
Der Verbund kann auch eine gute Lösung für eine geografisch verteilte Organisation sein, die Suchzugriff auf Inhalte an ihren verschiedenen Standorten bereitstellen möchte, wenn jeder Standort über einen eigenen Suchindex verfügt. Da jeder Standort Suchergebnisse aus einem eigenen Index bereitstellt, ist es nicht erforderlich, einen zentralen Suchdienst bereitzustellen, der einen einzelnen, einheitlichen Index erstellt und darauf zugreift. In diesem Kontext kann der Verbund z. B. folgende Vorteile bieten:
Niedrige Bandbreitenanforderungen : Eine Organisation, die geografisch verteilt ist, verfügt möglicherweise nicht über die hohe Netzwerkbandbreite, die zum Durchforsten und Indizieren großer Mengen von Remoteinhalten erforderlich ist. Wenn eine Organisation mit einem Verbund arbeitet, bestehen die Hauptdaten, die für die Suche durch das WAN übertragen werden, nur aus einer Menge von Suchergebnissen aus jedem zum Verbund gehörenden Inhaltsrepository.
Aktualität der Suchergebnisse : Jede Abteilung innerhalb einer Organisation kann die lokalen Inhalte schneller durchforsten, als eine zentrale Suchbereitstellung in der Lage wäre, alle Inhalte in der gesamten Organisation zu durchforsten.
Variabilität bei der divisionalen Suche : Wenn eine Organisation einen Verbund verwendet, kann jede Abteilung innerhalb der Organisation eine eigene Suchumgebung bereitstellen und steuern. Die Geschäftsbereiche können die Suche an ihre Anforderungen und Vorlieben anpassen, z. B. mit einer eigenen Suchumgebung und eigenen Suchconnectors. Dies wäre bei einem zentralen Suchportal nicht möglich.
Begrenzte Größe von Suchindizes : Eine große, geografisch verteilte Organisation kann Millionen von Dokumenten enthalten. aufgrund der Infrastruktur nicht praktikabel, die zur Unterstützung eines solch großen Indexes erforderlich wäre. Der Verbund ermöglicht Benutzern in allen Geschäftsbereichen die Ausführung einzelner Suchvorgänge zum Finden relevanter Inhalte, die auf mehrere kleinere Suchindizes in der Organisation verteilt sind.
Verwenden von Ergebnisquellen für den Verbund
Zum Arbeiten mit einem Verbund in SharePoint Server wählen Sie auf der Seite Ergebnisquelle im Abschnitt Protokoll eines der folgenden Protokolle:
Protokoll | Abruf von Suchergebnissen von dieser Art von Suchanbieter |
---|---|
Remote SharePoint | Der Index eines in einer anderen SharePoint Server-Farm gehosteten Suchdiensts |
OpenSearch 1.0/1.1 | Eine externe Suchmaschine oder ein Feed, die/der das OpenSearch-Protokoll verwendet, z. B. Bing |
Exchange | Exchange Server 2013 |
Hinweis
Wenn Sie eines der Protokolle in der vorherigen Tabelle auswählen, müssen Sie auf der Seite Ergebnisquelle hinzufügen/bearbeiten auch andere verwandte Felder ausfüllen, um die Ergebnisquelle vollständig anzugeben.
Siehe auch
Grundlegendes zu Ergebnisquellen für die Suche in SharePoint Server
Konfigurieren der Ergebnisquellen für die Suche in SharePoint Server
Manage crawling in SharePoint Server
Default connectors in SharePoint Server
Standardmäßig durchforstete Dateinamenerweiterungen und analysierte Dateitypen in SharePoint Server