Ähnliches suchen (FAST Search Server 2010 for SharePoint)
Das Feature Ähnliches suchen ermöglicht das Suchen von Dokumenten, die ähnlich sind wie bereits abgerufene Abfrageergebnisse.
Letzte Änderung: Donnerstag, 1. September 2011
Die Ähnlichkeitsbewertung basiert auf einer statistischen Maßzahl. FAST Search Server 2010 for SharePoint erstellt automatisch eine Ähnlichkeitskomponente, die der Abfrage hinzugefügt wird.
Inhalt dieses Artikels
Typen von "Ähnliches suchen"-Abfragen
Referenz des Ähnlichkeitsvektors des Elements
Sortieren der Ergebnisse einer "Ähnliches suchen"-Abfrage
Gilt für: SharePoint Server 2010
Typen von "Ähnliches suchen"-Abfragen
Diese Eigenschaft stellt den Typ der auszuführenden "Ähnliches suchen"-Abfrage dar.
Die nach abnehmender Gewichtung sortierten Dokumentvektoren für jedes Element können verwendet werden, um drei Typen von Ähnlichkeitssuchen für ein Element d auszuführen, unter Voraussetzung einer ursprünglichen Abfrage Q. Diese Anforderungen einer Ähnlichkeitssuche werden unter Verwendung der folgenden neuerstellten Abfrage (dargestellt unter Verwendung einer symbolischen Darstellung, nicht der exakten Abfragesprache) in eine neue eindeutige Abfrage umgewandelt:
FindSimilar: Query = Q OR <s1,w1> [OR <sm,wm>]* Die Ähnlichkeitsvektoren werden der Abfrage unter Verwendung eines OR-Operators hinzugefügt. Dies bedeutet, dass die ursprüngliche Abfrage in der neugeschriebenen Abfrage enthalten ist, die neue Abfrage kann jedoch mehreren Elementen entsprechen, selbst wenn die ursprüngliche Abfrage nicht erfüllt wurde.
RefineSimilar: Query = Q AND (<s1,w1> [OR <sm,wm>]*) Die Abfrage ist erfolgreich, wenn die ursprünglichen Abfragebedingungen und die Bedingungen des Ähnlichkeitsvektors erfüllt werden. Engen Sie die ursprüngliche Abfrage beispielsweise soweit ein, dass sie Elemente enthält, die ähnlich dem in <SimilarTo> angegebenen Element sind.
ExcludeSimilar: Query = Q ANDNOT (<s1,w1> [OR <sm,wm>]*) Die Abfrage ist erfolgreich, wenn die ursprünglichen Abfragebedingungen erfüllt werden, jedoch nicht die Ähnlichkeitsbedingungen.
<s,w> zeigt den Ähnlichkeitsvektor des Elements an, wie dieser während der Verarbeitung des Elements berechnet wurde.
Standard: FindSimilar
![]() |
---|
Die der Abfrage hinzugefügte Ähnlichkeitskomponente (<s1,w1> [OR <sm,wm>]*) fragt den Standard-Volltextindex ab. |
Referenz des Ähnlichkeitsvektors des Elements
Diese Eigenschaft stellt beim Suchen nach ähnlichen Elementen eine Ähnlichkeitsreferenz dar. Dies ist eine Ähnlichkeitsvektordarstellung, die für jedes Element im Abfrageergebnis in der verwalteten docvector-Eigenschaft zurückgegeben wird.
Der Wert ist eine entsprechend dem folgenden Format formatierte Zeichenfolge:
[string1,weight1][string2,weight2]...[stringN,weightN]
Bei der Ausführung einer "Ähnliches suchen"-Abfrage muss das SimilarTo-Element einen string-Parameter mit dem Wert der verwalteten docvector-Eigenschaft des Elements enthalten, das als Ähnlichkeitsreferenz verwendet werden soll. Der Ähnlichkeitsvektor besteht aus einem Satz von "Begriff,Gewichtung"-Ausdrücken, die die wichtigsten Begriffe oder Konzepte in dem Element und der entsprechenden festgestellten Wichtigkeit (Gewichtung) angeben. Begriffe können einzelne Wörter oder Ausdrücke sein.
Die Gewichtung ist ein Gleitkommawert zwischen 0 und 1, wobei 1 die höchste Relevanz darstellt.
Der Ähnlichkeitsvektor wird während der Verarbeitung des Elements erstellt und gibt die wichtigsten Begriffe oder Konzepte in dem Element und die entsprechende Gewichtung an.
Sortieren der Ergebnisse einer "Ähnliches suchen"-Abfrage
Die FindSimilar-Eigenschaft gibt an, ob auf der Ähnlichkeit basierende Abfrageergebnisse nach Ähnlichkeit oder Rang sortiert werden sollen.
Wenn Sie eine "Ähnliches suchen"-Abfrage ausführen, können die Ergebnisse auf zwei Arten sortiert werden:
Nach Relevanz (Rang). Dies ist die Sortiermethode für normale Abfragen und entspricht SortSimilar="False".
Nach Ähnlichkeit. Dies ist die Standardsortierung für Ähnlichkeitsabfragen, bei der die ähnlichsten Elemente zuerst aufgeführt werden. Dies entspricht SortSimilar="True".
Standard: True