Поиск FAST for SharePoint – Решение старых задач новым способом

В линейке SharePoint появился сравнительно новый продукт FAST for SharePoint и я собираюсь кратко рассказать для решения каких задач его можно использовать.

Предыстория

Компания FAST, приобретенная Microsoft в 2008 году, была лидером на рынке систем поиска информации. Продукт FAST был нацелен на использование в государственных и коммерческих организациях, в науке, при решении узкоспециализированных задач. Поэтому поиск, обработка и индексирование текста были основаны не только на принципах, применяемых в популярных Интернет поисковых системах, но учитывали еще ряд дополнительных аспектов – профиль пользователя, метаданные используемые в компании, теги, важность ресурсов и многое другое, что имеет значение для отдельной компании и мало применимо для глобального поиска в Интернет.

Стоит отметить, что такие особенности как гибкость в настройке, высокая масштабируемость и производительность, что безусловно являются плюсами, оборачивались сложностью в настройке и внедрении продукта и, соответственно, высокой его стоимостью. Этот факт делал продукты FAST доступыми преимущественно для больших компаний.

В результате слияния компаний была начата разработка продукта, использующего алгоритмы FAST, но являющегося таким же доступным в стоимости, настройке и использовании приложением как привычный SharePoint. Собственно, про этот продукт я и веду речь.

Что такое FAST for SharePoint?

По своей сути FAST for SharePoint является надстройкой над SharePoint. FAST представляет собой отдельный поисковый “движок” и набор SharePoint веб-частей.

Движок имеет доступ к разным источникам информации, умеет преобразовывать разнообразные форматы документов (также его можно научить своим преобразованиям) и индексирует текст. При индексации он разбирает текст на смысловые части и выделяет атрибуты, такие как компания, должность, тип документа, город и прочее. Вы можете сами научить его выделять собственные атрибуты, если построите свое правило и снабдите систему возможными значениями этих атрибутов. FAST умеет работать с 80 языками и знает все тонкости 45 языков, в число которых входит и русский. Запросы пользователей, производимые через веб-часть SharePoint, также обрабатываются отдельной ролью поискового движка, при этом результаты поиска строются для каждого пользователя персонально – финансист получит один набор результов по ключевому слову ERP, а системный администратор – совсем другие, более релевантные его работе в компании.

С точки зрения пользователя FAST for SharePoint – невидимый продукт. Для пользователя лишь появится больше функционала в новых веб-частях поиска на привычном портале SharePoint.

Краткие отличия в функциональности продуктов SharePoint 2010 и FAST for SharePoint

Вот сравнение функциональности продуктов:

Различия в фунциональности

SP2010

FS4SP
Обычный поиск да да
Поиск людей и компетенций да да
Индексирование файловых папок, Exchange, Lotus Notes и других источников да да
Настройка релевантности поиска частично да
Фильтрация результатов по атрибутам частично да
Настройка представления результатов частично да
Высокая производительность и масштабирование (более 100 миллионов документов)   да
Создание собственных приложений с использованием алгоритмов поиска   да
Извлечение атрибутов из текста (компания, город, продукт и прочее)   да
Предпросмотр документов на сайте   да
Баннеры для лучшей ссылки по теме   да
Задача

Рекомендованное решение

Интранет Поиск SharePoint 2010
Поиск с незначительной настройкой интерфейса и определение областей поиска SharePoint 2010
Высокая производительность и масштабирование поиска FAST Search for Sharepoint
Специализированное приложение FAST Search for Sharepoint
Визуализация результатов поиска и предпросмотр документов FAST Search for Sharepoint

Решаемые задачи

В компаниях, как правило, используются несколько систем и способов хранения и управления документами. Зачастую документы хранятся на плохо приспособленных для этих задач файловых папках или на персональных компьютерах. В крупных компаниях в различных филиалах могут использоваться несколько систем управления документами и множество информационных систем. image

В такой ситуации задача систематизировать уже имеющуюся информацию, интегрировать информационные системы между собой, выработать регламенты и обязательные атрибуты для создания и хранения документов, а также внедрить все эти правила и поддерживать их выполнение представляется очень трудоемкой и трудновыполнимой. Как правило за нее даже не берутся или быстро прекращают попытки. В большинстве случаев технические сложности, пусть долго, но решаются, но вот заставить пользователей во всех подразделениях и филиалах поддерживать правила и заносить в карточки документов все необходимые атрибуты для последующей систематизации и анализа – вот основное препятствие. Вот эту-то задачу FAST и решает. Ведь представление результатов поиска позволяет не просто найти документы, но и консолидировать информацию из множества систем по ключевому слову и систематизировать ее, используя преднастроенные атрибуты.

Вот некоторые преимущества, которые будут получены после внедрения:

  • Можно консолидировать и проанализировать всю хранимую в электронном виде информацию в компании и систематизировать ее по интересующим атрибутам (типы документов, контрагенты, города, авторы, номенклатура, предприятия и прочее). Имеются богатые возможности визуализации, которые упростят восприятие информации и помогут найти требуемое быстрее и оценить результат.
  • Доступ к информации существенно упростится - SharePoint является единственной точкой входа, а просмотр документа становится возможным без его скачивания – в режиме предпросмотра в браузере.
  • Т.к. можно индексировать любую информацию в компании создаваемую сотрудниками (документы, письма, мгновенные сообщения, форумы, информационные системы и базы данных) - появляется возможность консолидировать информацию из разнообразных источников не интегрируя их между собой
  • Т.к. практически каждый документ или текст в компании можно ассоциировать с автором, появляется возможность оценивать компетенции сотрудников и быстро находить экспертов, что зачастую намного эффективнее поиска самих документов.

Это лишь несколько очевидных новых возможностей для компании от внедрения. Гибкие возможности настройки поиска предоставляют новые пути решения специфических задач.

Где еще можно почитать?

Кроме поиска по теме в Интернет, рекомендую посмотреть на официальный сайт и использвать вот эти презентации - Базовая, Техническая.

UPDATE: По прошествию времени появился отличный обзор FAST от Романа Щемелева (менеджера продукта SharePoint в России).