Специальная обработка контента с помощью выноски веб-службы "Обогащение контента"
Узнайте о выноске веб-службы обогащения содержимого в SharePoint, которая позволяет разработчикам создавать внешнюю веб-службу для изменения управляемых свойств для элементов, для обхода контента во время обработки контента.
Поиск в SharePoint позволяет пользователям изменять управляемые свойства элементов, для которых выполняется обход контента, перед индексированием путем вызова внешней веб-службы обогащения контента. Возможность изменения управляемых свойств для элементов во время обработки контента функция полезна, если для выполнения задач, таких как очистка данных, извлечение сущностей, классификации и тегов.
Рис. 1. Обогащение контента при обработке контента
На рисунке 1 показана часть процесса, который выполняется в компонент обработки контента. Веб-служба повышения качества контента это служба на основе SOAP, можно создать для получения выноски от клиента веб-службы в компонент обработки контента. На рисунке 1 клиент веб-службы ссылается на оператор обогащения содержимого внутри компонента обработки содержимого; веб-служба относится к реализуемой веб-службе SOAP. Веб-служба получает настраиваемые полезные данные от компонента обработки содержимого. Затем результирующий ответ от веб-службы объединяется для обхода элементов перед добавлением в индекс поиска.Клиент веб-службы для работы с управляемыми свойствами, которые можно настроить как входные свойства или свойства выходных данных. Входные свойства, передаются в веб-службе. Вывод свойств возвращаются веб-службой. Некоторые управляемые свойства являются скрытыми или доступны только для чтения и не может отправленных веб-службы или полученных от веб-службы. Сведения о том, как проверить, какие управляемые свойства доступны только для чтения, см. в статье Как получить список всех управляемых свойств, доступных только для чтения, для веб-службы обогащения содержимого .
Важно!
[!Важно!] Действие выноски повышения качества контента можно настроить только с конечной одного веб-службы. Любой тип отказоустойчивость или возможности для поддержки нескольких реализаций маршрутизации должны обрабатываться разработчиком, реализация веб-службы. Кроме того разработчик может иметь различные веб-службами, размещенных на разных конечные точки; Тем не менее в любой момент времени, можно использовать только один из этих конечных точек в конфигурации.
Контракт службы web повышения качества контента
Клиент веб-службы это клиент SOAP (версия 1.1) RPC с предварительно заданных поведение. Контракт службы web имеет следующие характеристики:
- Компонент обработки контента отправляет вызов SOAP RPC настраиваемая конечной точки по протоколу HTTP.
- Полезные данные содержит массив объектов свойства.
- Веб-службы выполняет некоторые настраиваемой логики на массив объектов, свойств и возвращает массив объектов измененного или нового свойства.
- Веб-службы необходимо отправки ответа клиенту веб-службы в течение заданного периода ожидания.
- Нет определенных механизмов проверки подлинности и шифрования, поддерживаются как часть контракта. Тем не менее, можно применять собственные безопасности механизм транспорта.
Настройка клиента повышения качества контента веб-службы
Чтобы настроить клиент веб-службы, используйте следующие командлеты Windows PowerShell:
- Get-SPEnterpriseSearchContentEnrichmentConfiguration
- Set-SPEnterpriseSearchContentEnrichmentConfiguration
- Remove-SPEnterpriseSearchContentEnrichmentConfiguration
- New-SPEnterpriseSearchContentEnrichmentConfiguration
В таблице 1 перечислены свойства, которые можно настроить через Windows PowerShell командлеты, указанным выше.
Таблица 1. Свойства, настраиваемые для клиента с помощью командлетов Windows PowerShell
Свойство конфигурации | Описание | Значение по умолчанию |
---|---|---|
Endpoint | URL-адрес внешнего веб-службы. | empty |
InputProperties | Управляемые свойства, которые получает внешние веб-службы. | empty |
Выходные свойства | Управляемые свойства, возвращает внешних веб-службы. | empty |
Timeout | Количество времени до раз службы web извлечения в миллисекундах. В зависимости от FailureMode элемент не удается обработать или предупреждения, записывается в журнал ULS. | 5000 миллисекунд; Допустимый диапазон [100, 30000]. |
SendRawData | Включает или отключает отправке необработанных данных в веб-службу. | false |
MaxRawDataSize | Максимальный размер необработанных данных, отправляемых в веб-службу в килобайтах (КБ). Если двоичные данные элемента превышает это ограничение, элемент не отправляются. Это не запрещает InputProperties отправку и OutputProperties получению. | 5120 КБ. |
FailureMode | Управляет поведением клиента веб-службы, при возникновении ошибки. Если FailureModeERROR, всех проблем, возникающих при обработке повышения качества контента отправлять неудавшегося обратного вызова для этого конкретного элемента. Если FailureModeWARNING, индексируются элемент без каких-либо изменений веб-службой и предупреждения, записывается в журнал ULS. | Ошибка |
DebugMode | Режим, если параметр имеет значение true позволяет клиента повышения качества контента для отправки все управляемые свойства клиенту без ожидания все свойства в ответ. Все настроенные Trigger свойств, InputProperties и OutputProperties свойства игнорируются. | false |
Trigger | Предикат Boolean, который выполняется на всех элементов для обхода. Если предикат принимает значение true, эту запись отправляется в веб-службу. В противном случае элемент передается через в индекс поиска. | empty |
Вывод списка всех только для чтения управляемых свойств для повышения качества контента веб-службы
Некоторые управляемые свойства доступны только для чтения и не может быть выходных данных из веб-службы. Эти свойства можно перечислить с помощью командлетов Get-SPEnterpriseSearchServiceApplication и Get-SPEnterpriseSearchMetadataManagedProperty Windows PowerShell, показанных в следующем примере:
$ssa = Get-SPEnterpriseSearchServiceApplication
Get-SPEnterpriseSearchMetadataManagedProperty -SearchApplication $ssa | ?{$_.IsReadOnly -or $_.MappingDisallowed -or $_.DeleteDisallowed}
Об условиях запуска по настройке вызов веб-службы
Условие запуска - это выражение, которое используется для настройки вызов веб-службы. Если триггер условие имеет значение true, клиент веб-службы выполняет выноски для этой записи. Если триггер условие имеет значение false, клиент веб-службы не выполняет выноски и передает для обхода элементов в индекс поиска. Кроме того, если условие не триггер настроен; все элементы, передаются в веб-службы.
Условия запуска используйте язык выражений ссылаться на значения управляемого свойства. Операторы и функции в язык выражений можно использовать для создания простых и сложных триггер условий, можно определить, когда следует выполнить вызов веб-службы.
В таблице 2 приведены примеры условия запуска.
Табл. 2. Примеры условий триггера для настройки выноски веб-службы обогащения содержимого
Выражение | Описание | Требования |
---|---|---|
MP1 > 2 | Возвращает true, если значение управляемого свойства с именем MP1 больше 2. | MP1 должны иметь числовой тип. |
IsNull(MP2) | Возвращает true, если управляемое свойство с именем MP2 не отображается для элемента для обхода или empty и null. | MP2 может быть любого типа. |
StartsWith(MP1, "sample") и MP2! = 18 | Возвращает true, если значение в управляемом свойстве MP1 начинается с "Пример" и значение управляемого свойства MP2 не 18. | MP1 должен иметь тип string и MP2 должен быть числовым типом. |
IsDay (MP1, 2009 г., 12, 24) | Проверяет, содержит ли управляемое свойство MP1 DateTime на 24 декабря 2009 г. | MP1 должен иметь тип DateTime. |
Элементы, которые можно использовать в выражении триггера, и список поддерживаемых функций см. в разделе Синтаксис выражений триггеров в SharePoint .
Реализация повышения качества контента внешние веб-службы
Базовой реализации выполните следующие действия:
- Включите Microsoft.Office.Server.Search.ContentProcessingEnrichment.dll, расположенный в
C:\\Program Files\\Microsoft Office Servers\\15.0\\Search\\Applications\\External
в проект в качестве ссылки. - Реализация IContentProcessingEnrichmentService как веб-службы.