Поделиться через


Планирование свойств метаданных для поиска (Search Server 2010)

 

Применимо к: Search Server 2010

Последнее изменение раздела: 2011-04-25

В этой статье описывается порядок планирования свойств метаданных для поиска в Microsoft Search Server 2010. В процесс обхода контента программой-обходчиком также включаются метаданные, связанные с этим контентом, например, сведения об авторе, названии и адресе электронной почты. Эти данные хранятся в поисковой системе в виде свойств для обхода и управляемых свойств. Свойства для обхода, например, имя автора, название или тема, извлекаются из документов в процессе обхода контента. Управляемые свойства — это свойства для обхода, которые могут появляться в уточненных или расширенных результатах поиска. При выполнении обычного поиска в набор результатов включаются элементы с любыми свойствами для обхода. Чтобы реализовать возможность уточнения результатов, требуется планирование управляемых свойств. Эти свойства могут использоваться в уточненных результатах поиска и, таким образом, позволяют повысить эффективность и релевантность выполняемых пользователем запросов. В Search Server 2010 представлен набор управляемых свойств по умолчанию, однако при необходимости можно создавать новые управляемые свойства и сопоставлять свойства для обхода с управляемыми свойствами, которые отображаются в результатах поиска.

Уточнение результатов может выполняться только для управляемых свойств и недоступно в отношении свойств для обхода. Если требуется использовать свойство для обхода при уточнении результатов поиска, необходимо сопоставить его с управляемым свойством. Допускается сопоставление нескольких свойств для обхода с одним управляемым свойством и наоборот. Если с управляемым свойством сопоставлено несколько свойств для обхода контента, и в документе определены значения нескольких свойств для обхода, приоритет и порядок сопоставления этих свойств определяет значение управляемого свойства.

Например, в трех разных типах документов могут использоваться разные имена свойств, определяющих автора. Например, это могут быть свойства «Автор», «Писатель» и «Свойство3». Несмотря на то, что все они являются свойствами для обхода, при выполнении пользователем запроса по автору (например, при вводе строки автор:Владимир Егоров в поле поиска) в результатах поиска отображаются только документы со свойством «Автор». Чтобы включать в уточненные результаты документы, в которых эти свойства носят другие имена, необходимо сопоставить каждое из этих свойств с управляемым свойством «Автор».

Содержание:


  • Управляемые свойства


  • Сокращение числа повторяющихся управляемых свойств


  • Добавление свойств для основных понятий в информационной архитектуре


  • Сценарий

Управляемые свойства

Для создания эффективного набора управляемых свойств необходимо проанализировать наиболее важный контент в поиске метаданных, которые можно сопоставить с управляемыми свойствами.

Обнаружить свойства контента, не выполняя его обход, достаточно сложно. В связи с этим планирование управляемых свойств рекомендуется выполнять только после того, как будет проанализирован контент в каждом семействе сайтов. После этого можно выполнить обход всего контента с использованием тестового сервера. В результате этого процесса будет получен список свойств для обхода, который будет сравниваться с информационной инфраструктурой при создании управляемых свойств. Тем не менее, даже после нескольких обходов контента системы при сопоставлении свойств возможны трудности. Это связано со сложностями при определении типа контента или приложения, которые используют конкретное свойство. Если точные сведения об использовании конкретного свойства отсутствуют, можно реализовать сопоставление в тестовой среде и поэкспериментировать с поиском по этому свойству.

Многие полезные управляемые свойства создаются автоматически при установке Search Server 2010. Они могут использовать в качестве отправной точки при планировании других управляемых свойств. К автоматически создаваемым свойствам относятся следующие:

  • Автор

  • Описание

  • Имя сайта

  • Тип

  • Размер файла

  • Дата изменения

  • URL-адрес

  • Название

Обратите внимание, что для эффективного поиска с использованием свойств сначала необходимо присвоить значения свойствам для обхода. Например, если в документе Microsoft Word 2010 присутствует свойство «Автор», сопоставленное с управляемым свойством «Автор», и этому свойству не присвоено значение, при выполнении пользователями поисковых запросов по свойству «Автор» этот документ не будет включаться в результаты поиска. Чтобы обеспечить максимальную эффективность уточненных результатов поиска, рекомендуется внедрить решение для управления корпоративным контентом, в котором присутствуют функции планирования метаданных документов. Дополнительные сведения о планировании метаданных документов см. в статьях Планирование управляемых метаданных (SharePoint Server 2010) и Планирование типов контента и рабочих процессов (SharePoint Server 2010). Дополнительные сведения о решении для управления корпоративным контентом см. в статье Планирование управления корпоративным контентом (SharePoint Server 2010).

Дополнительные сведения об управлении свойствами метаданных см. в статье Manage metadata properties for search (Search Server 2010)

Сокращение числа повторяющихся управляемых свойств

В различных типах контента некоторые основные свойства могут отображаться как разные свойства для обхода. Например, свойства для обхода «Владелец», «Писатель» и «Кем создано» могут быть синонимичны свойству «Автор». Сокращение числа повторяющихся свойств является одной из важнейших задач процесса планирования. Это означает, что необходимо создать один набор управляемых свойств и сопоставить свойства для обхода, имеющие схожие значения, с управляемыми свойствами. В этом случае необходимо сопоставить свойства «Владелец», «Писатель» и «Кем создано» с управляемым свойством «Автор».

При необходимости можно назначать приоритеты нескольким свойствам для обхода. Это позволяет в тех случаях, когда в процессе обхода найдено несколько свойств, использовать только значения свойств с наивысшим приоритетом в запросах на основе управляемых свойств или свойств. Если такие приоритеты не определены, в запросах используются значения всех свойств для обхода, сопоставленных с управляемыми свойствами. Таким образом, управляемое свойство может быть многозначным. Это означает, что запрос будет возвращать результаты для всего контента, в которых будут представлены значения любых управляемых свойств, соответствующих условиям запроса. Рекомендуется использовать однозначные свойства. Для этого следует выбрать в качестве управляемого свойства то, которое чаще других присутствует в обходе контента, а затем определить приоритеты управляемых свойств в соответствии с частотой их появления. Определить то, какие свойства присутствуют в обходе контента чаще других, не всегда легко, и один из подходов к решению этой проблемы заключается в назначении свойствам приоритетов в соответствии с использующими их приложениями. Например, в документах Microsoft Office 2010 присутствует стандартный набор свойств, таких как «Автор», «Название», «Компания», «Тип» и другие. Если большинство пользователей работают в приложениях Microsoft Office 2010, а в наборе контента также представлены документы других приложений, рекомендуется сопоставить их свойства со свойствами документов, созданных Office 2010. Например, если в документах, созданных в других приложениях, присутствует свойство Писатель, можно сопоставить его с управляемым свойством Автор.

Постарайтесь избежать сопоставления с плохо сопоставленными или нерелевантными свойствами. Это может привести к уменьшению релевантности результатов поиска. Например, сопоставление свойства Кем сохранено с управляемым свойством Автор может привести к возврату менее релевантных свойств. По возможности перед исходным развертыванием проведите тестирование поиска с использованием управляемых свойств и запланируйте проверку данных об использовании поисковых запросов в процессе обычной работы для дальнейшей оптимизации сопоставленных свойств. Дополнительные сведения о проверке данных об использовании поисковых запросов см. в статье Просмотр отчетов Web Analytics (SharePoint Server 2010).

Добавление свойств для основных понятий в информационной архитектуре

Помимо свойств для обхода, которые сопоставляются с управляемыми свойствами по умолчанию, другие свойства для обхода могут явно сопоставляться с понятиями в информационной архитектуре, сбор которых осуществляется с использованием существующих управляемых свойств. Например, в информационной архитектуре организации обслуживание клиентов может быть определено как ключевой бизнес-процесс. При этом к основным понятиям, связанным с обслуживанием клиентов, можно отнести клиентов, представителей службы поддержки, а также регионы обслуживания клиентов.

Для каждого понятия в информационной архитектуре необходимо определить наличие свойства для обхода, представляющего понятие, которое можно сопоставить с управляемым свойством. Если такое свойство есть, его следует сделать управляемым.

Сценарий

В бизнес-приложении отслеживаются данные клиентов и сотрудников. Свойства этих данных являются вероятными кандидатами на роль управляемых свойств после их регистрации в каталоге бизнес-данных и обхода контента в составе источника контента бизнес-данных. Также могут присутствовать свойства для обхода приложений, которые требуется сопоставить с этими управляемыми свойствами, например, свойства, определяющее идентификатор представителя службы поддержки в отдельном приложении, или свойство «Автор» в приложениях, которые используются исключительно представителям службы поддержки. В поисковый запрос, в котором используется это свойство или связанный с ним термин, будут включены результаты для всех элементов, содержащих любое из свойств для обхода, сопоставленных с управляемым свойством идентификатора представителя службы поддержки.

С каждым важным бизнес-процессом в информационной архитектуре связан набор типов файлов или приложений для работы с бизнес-данными, которые можно использовать для определения возможных управляемых свойств.

Обратите внимание, что, хотя многие понятия в информационной архитектуре не представлены свойствами, они используются при планировании структуры сайтов и реализации других функций поиска. В информационной архитектуре могут присутствовать управляемые свойства, которые вам не удалось обнаружить. Тем не менее, сам факт наличие понятия в информационной архитектуре вовсе не означает, что для него должно существовать соответствующее управляемое свойство.