Архитектура компонента Full-Text Search
Изменения: 14 апреля 2006 г.
Компонент Full-Text Search в Microsoft SQL Server 2005 работает на основе средства полнотекстового поиска (Microsoft) для SQL Server (MSFTESQL). Служба MSFTESQL выполняет две задачи: обеспечивает поддержку индексирования и выполнения запросов.
Архитектура компонента Full-Text Search в SQL Server проиллюстрирована далее.
Эта архитектура состоит из следующих процессов:
- Процесс SQL Server (Sqlservr.exe)
- Процесс компонента Microsoft Full-Text Engine для SQL Server (Msftesql.exe)
- Процесс управляющей программы фильтрации для компонента Microsoft Full-Text Engine (Msftesql.exe)
Каждый из этих процессов содержит в себе несколько компонентов, описание которых приведено в следующих разделах.
Процесс SQL Server
Процесс SQL Server состоит из следующих компонентов:
- Пользовательские таблицы.
В этих таблицах содержатся данные, по которым осуществляется полнотекстовое индексирование. - Сопоставление ключей.
В этом компоненте содержится сопоставление значений данных между столбцами полнотекстового ключа и внутренними идентификаторами документа. - Обработчик запросов SQL Server.
- Средство сбора полнотекстовых данных Microsoft.
Этот компонент отвечает за планирование и реализацию заполнения полнотекстовых индексов, а также за мониторинг полнотекстовых каталогов.
Процесс компонента Microsoft Full-Text Engine для SQL Server (MSFTESQL)
Служба MSFTESQL отвечает за следующие действия:
- Заполнение и управление полнотекстовыми каталогами.
- Упрощение полнотекстового поиска в базах данных SQL Server.
Процесс MSFTESQL содержит компоненты, перечисленные в следующей таблице.
Компонент | Описание |
---|---|
Диспетчер управляющей программы фильтрации |
Отвечает за мониторинг состояния процесса управляющей программы фильтрации для полнотекстового поиска Microsoft (MSFTEFD). |
Индексатор |
Создает структуру инвертированного индекса, используемого для хранения индексированных лексем. Дополнительные сведения см. в разделе Структура полнотекстового индекса. |
Файлы тезауруса |
Содержат синонимы искомых термов. Дополнительные сведения см. в разделе Тезаурус. |
Файлы неучитываемых слов |
Содержат списки часто встречающихся слов, бесполезных при поиске. Дополнительные сведения см. в разделе Неучитываемые слова. |
Средства разбиения по словам и парадигматические модули |
Осуществляют лингвистический анализ всех полнотекстово-индексированных данных. Средство разбиения по словам — это компонент, определяющий местонахождение границ слова в потоке текста в строке, включаемой в полнотекстовый индекс. Парадигматические модули определяют основную форму слова. Например, слова «бежит», «бежал» и «бегут» являются формами слова «бежать». Парадигматические модули используются службой MSFTESQL при выполнении запросов FREETEXT либо в случае, когда запрос требует флективного расширения. |
Дополнительные сведения см. в разделе Средства разбиения по словам и парадигматические модули.
Дополнительные сведения о службе MSFTESQL см. в разделе Средство полнотекстового поиска (Майкрософт) для SQL Server.
Процесс управляющей программы фильтрации для компонента Full-Text Search Microsoft (MSFTEFD)
Процесс MSFTEFD запускается службой MSFTESQL в процессе полнотекстового индексирования. Процесс MSFTEFD содержит компоненты, отвечающие за доступ к данным в таблицах и их фильтрацию, а также за разбиение на слова и выделение основы:
- Обработчик протоколов.
В SQL Server 2005 этот компонент осуществляет доступ к данным в таблице, находящейся в указанной базе данных. - Фильтры.
Выделение потока текстовых данных из документа с отбрасыванием всех нетекстовых данных и данных о форматировании. Дополнительные сведения см. в разделе Фильтры полнотекстового поиска. - Средства разбиения по словам и парадигматические модули.
Внутренние таблицы
Компонент Full-Text Search использует следующие внутренние таблицы:
- fulltext_index_map — содержит сопоставление значений данных в столбцах полнотекстового ключа с внутренними идентификаторами, уникально определяющими документ.
- fulltext_catalog_freelist — содержит неиспользуемые идентификаторы документов.
Примечание. |
---|
Эти таблицы предназначены исключительно для внутреннего использования. Их нельзя изменить, и к ним нельзя обращаться с запросами. Обратная совместимость, а также наличие этих таблиц в следующих версиях SQL Server не гарантируются. |
См. также
Основные понятия
Средство полнотекстового поиска (Майкрософт) для SQL Server
Процесс полнотекстового индексирования и обработки запросов
Другие ресурсы
Справка и поддержка
Получение помощи по SQL Server 2005
Журнал изменений
Версия | Журнал |
---|---|
14 апреля 2006 г. |
|